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谁 需要 阅读 本 书 

如 果 您 是 一 直 关 注 了 商业 智能 领域 友 展 变化 的 信息 技术 领域 专业 人 员 ， 或 者 是 正在 考虑 涉 
足 这 个 友 满 机 会 的 商业 智能 领域 ， 同 时 又 迷失 在 海 如 烟 海 的 文献 和 书籍 中 不 知 所 措 ， 如 果 您 
希望 得 到 一 本 简单 明了 ， 同 时 又 是 专门 为 信息 技术 领域 专业 人 员 量 身 定 制 的 商业 智能 方面 的 
书籍 ， 那 么 这 本 书 很 适合 你 。 

在 内 容 上 ， 本 书 儿 乎 涵盖 了 商业 智能 的 方方面面 ， 同 时 又 强 调 特 定 的 草 点 ， 可 以 由 浅 入 
深 ， 循 序 渐进 地 市 您 进入 丙 业 智能 的 世界 。 

本 书 可 以 为 你 做 什么 

本 书 内 容 全 面 详细 ， 从 中 您 可 以 学 到 商业 智能 领域 各 个 方面 的 重要 内 容 。 书 中 涵 癌 了 进入 
商业 智能 领域 所 需要 的 几乎 所 有 的 理论 知识 ， 但 是 本 书 并 不 推 守 细 市 性 的 理论 知识 讲述 ， 因 为 
每 一 部 分 理论 都 可 以 写成 一 本 书 。 本 书 主 要 是 针对 项 目 中 所 遇 到 的 问题 ， 商 业 智 能 项 目 开 发 的 
般 流 程 ， 尤 其 针对 初学 者 如 何 能 够 很 快 进入 到 项 目 中 ， 这 本 书 对 他 们 来 说 共有 极 高 的 参考 价 
值 ， 由 于 笔者 是 在 电力 行业 工作 ， 所 以 会 适当 列举 一 些 电 力行 业 的 例子 作为 参考 。 本 书 涵盖 的 
知识 点 很 多 , 但 是 全 书 分 成 如 下 几 个 部 分 。 SEV: 包括 进入 到 商业 智能 领域 之 前 的 准备 知识 、 
商业 智能 人 徐 介 、 数 据 仓库 的 基本 理论 知识 、 商 业 智 能 ETL AALE RE OLAP 报表 分 析 等 方面 的 
理论 知识 。 项 目 篇 : 包括 如 何 应 用 丙 业 智能 ， 如 何 进 行商 业 智 能 项 目 需求 的 定义 ， 如 何 开 发 数 
据 仓 库 系 统 ， 如 何 实现 ETL 数据 抽取 和 OLAP 多 维 分析 等 方面 的 内 容 。 工 具 篇 : 详细 介绍 两 大 
商业 智能 工具 Cognos — Informatica 的 理论 知识 和 使 用 方法 。 实 践 饥 : 包括 Cognos 报表 的 开发、 
部 考 和 实践 。 本 书 附 赠 部 分 源 代 码 和 一 些 有 价值 的 文档 模板 。 

阅读 背景 

目前 ， 很 多 公司 引入 了 商业 智能 。 商 业 智 能 已 经 不 是 单纯 的 、 仅 供 科 研 和 实验 的 概念 了 ， 
它 已 经 成 为 了 企业 信息 化 的 重要 的 解决 方案 和 技术 手段 。 从 零售 企业 到 金融 机 构 ， 从 电力 行 
业 到 环保 产业 ， 商 业 智 能 正在 引起 一 场 商业 分 析 和 战略 决策 的 革命 。 预 计 ， 很 快 国内 外 超过 
半数 的 企业 都 会 使 用 商业 智能 技术 去 开拓 和 抢占 市 场 了 。 小 时 候 曾 经 有 一 本 书 给 我 留 下 了 深 
刻 的 印象 ， 大 概 内 容 是 教 小 学 生 如 何 写 作文 的 ， 包 括 如 何 写 议 论文 、 记 令 文 、 散 文 等 。 书 中 
并 没有 很 刻板 地 去 前 述 写 作 的 步骤 ， 而 是 通过 主人 公 CONO 的 一 个 个 小 故事 ， 把 一 些 看 似 
偶然 ， 却 又 非常 合理 的 情节 ， 包 括 在 公园 、 火 和 车站、 旅游 景点 等 场景 下 ， 以 对 话 的 形式 将 与 
作 的 方法 一 一 告诉 谈 者 ， 语 言 风 趣 幽 默 ， 主 人 公 “《〈 小 胖 ) 的 写作 水 平 得 到 了 长 足 的 提高 ， 同 
时 吴 为 读者 的 我 们 也 有 了 相当 大 的 收获 ， 时 隔 几 十 年 ， 仍 然 让 我 不 能 瑟 怀 。 本 书 的 内 容 ， 虽 
然 不 能 以 故事 情节 或 者 对 话 的 形式 展现 给 大 家 , 但 是 也 尽量 不 用 星 深 难 异 的 语言 去 解释 概念 ， 
而 是 用 简单 易 慌 的 例子 去 说 明 问 题 。 本 书 以 形象 生动 的 语言 ， 由 浅 入 深 地 进行 讲解 ， 让 初学 
者 能 够 很 快 进 入 到 商业 智能 的 世界 中 ， 同 时 也 可 让 专业 人 士 轻 松 阅 读 。 

在 本 书 的 编写 中 ， 王 飞 主 要 负责 理论 篇 和 项 目 篇 ， 刘 国峰 主要 负责 工具 篇 和 实践 篇 。 
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我 要 感谢 帮助 我 完成 这 本 书 的 所 有 人 。 

首先 感谢 ] 诚 者 师 的 悉心 指导 ， 如 果 没 有 他 ， 婚 没有 本 书 的 出 版 。 同 时 感谢 刘 国 峰 对 本 
书 的 重要 页 献 ， 他 为 本 书 的 出 版 付出 了 目 己 的 心血 和 努力 。 

感谢 公司 的 同事 们 ， 他 们 都 以 各 种 方式 为 本 书 的 编写 做 出 了 页 献 ， 在 这 里 特别 感谢 悉 超 
源 主 任 和 李 永 红 经 理 给 予 的 文 持 和 或 励 ， 同 时 感谢 弄 量 给 予 的 技术 文 持 和 玫 助 。 

最 后 ， 也 是 最 重要 的 ， 我 要 感谢 家 庭 给 予 我 的 不 懈 文 持 ， 如 末 没 有 母亲 (张丽华 )、 父 杀 ( 王 
HA) LARWE H BARER). 特别 是 我 的 妻子 (丁玲 玲 )， 刚 出 生 的 女儿 ( 王 预 
营 )。 他 们 给 予 了 我 最 大 的 精神 文 持 和 带 助 ， 如 于 没有 他 们 ， 我 很 难 想 象 能 完成 这 本 书 。 
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这 本 书 的 面世 ， 得 到 了 很 多 人 的 易 力 相助 ， 请 允许 我 在 此 逐一 进行 感谢 。 

写 书 的 这 个 想法 最 初 是 王 飞 提出 来 的 ， 同 时 在 丁 诚 老 师 和 刘 博 老师 的 易 力 相助 下 才 有 了 
这 本 书 的 面世 。 

这 本 书 的 执笔 从 2010 年 的 秋季 束 已 经 开始 了 。 我 和 合作 者 王 飞 的 写作 环境 基本 上 是 一 样 
的 ， 每 天 下 班 后 晚上 7 点 到 家 ， 双 方 的 爱人 同时 都 处 于 怀孕 的 初期 ， 在 她 们 的 理解 和 至 励 下 ， 
我 们 每 天 坚持 写作 到 竣 晨 1 后 ， 最 后 终于 完成 了 本 书 的 创作 。 所 以 非常 感谢 王 飞 的 受 人 和 我 
的 妻 子 ， 如 末 疫 有 她 们 在 育 后 的 玖 默 文 持 ， 我 们 不 可 能 坚持 完成 这 本 书 的 写作。 在 此 我 齐 代 
表 我 和 王 飞 ， 感 谢 育 后 文 持 我 们 的 家 人 和 朋友 ， 万 分 感谢 ! 
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本 章 目标 
什么 是 商业 智能 ? 什么 样 的 企业 需要 商业 智能 ? 商业 知 能 在 这 些 企 业 里 友 挥 了 怎样 的 重要 作 
用 ? 或 者 说 两 业 智能 给 我 们 的 生活 市 来 了 哪些 便利 ?下 和 面 完 了 解 喘 边 的 几 个 应 用 商业 稼 能 的 例子 : 
e 大 家 知道 ， 商 业 银行 的 网 点 非常 多 ， 每 家 网 点 的 现金 流 每 天 都 是 不 一 样 的 ， 那 么 银行 
面临 的 问题 就 来 了 : 怎么 解决 或 者 平衡 各 网 点 的 现金 访问 题 ? 
e 大 家 部 用 过 日 度 搜索 引擎 ， 在 搜索 关键 字 的 时 候 ， 如 朱 我 们 想 搜 “伊拉克 战争 ” 却 
打 成 了 “ 伊 拉 砚 站 第 ”百度 的 显示 结果 外 最 前 而 会 提示 : 您 是 不 是 要 搜索 “伊拉克 












































战争 ” ? 
e 某 发 电 行业 如 何 根据 历史 发 电量 、 历 史 增长 率 和 其 他 相关 的 因素 去 预测 未 来 几 年 的 用 
电 需求 ? 





e 笔者 前 坚 日 子 连 续 两 次 在 南方 航空 公司 订 景 系统 网 站 ， 购 买 大 连 和 育 岛 到 北 泵 的 往返 
机 有 过， 后 来 持续 一 年 ,每 阳 一 周 束 能 收 到 航空 公司 的 天 于 三 亚 符 价 机 票 和 酒店 的 邮件 
和 短信 提示 。 那么 该 订 桶 系统 如 何 根 据 个 人 的 历史 订 架 记录 去 预测 未 来 哪些 潜在 客户 
会 在 什么 时 段 内 需要 预订 哪些 紧 ? 
针对 以 上 问题 ， 本 章 对 商业 智能 做 了 概述 性 的 介绍 ， 重 点 讲解 了 商业 智能 在 企业 中 的 重 
要 性 和 作用 ， 并 且 预 测 了 商业 智能 的 发 展 趋势 和 实施 商业 智能 的 一 般 步 枝 ， 使 该 者 对 商业 知 
能 有 一 个 初步 认识 。 
学 习 本 章 后 ， 您 将 学 握 : 
e 商业 智能 的 作用 。 
e 疝 业 智能 的 功能 。 
e 商业 智能 的 发 展 趋势 。 
e 
e 
e 



































商业 智能 的 实施 方法 和 步骤 。 
商业 智能 成 功 的 关键 。 
商业 智能 组 织 机 构 的 特点 。 
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1.1 商业 智能 介绍 


1.1.1 商业 智能 在 企业 中 的 作用 


首 经 看 过 这 样 一 个 例子 ， 关 国 东 超市 有 一 个 系统 ， 当 你 采购 了 一 车 的 物品 准备 结账 时 ， 
1 











美丽 的 收银 员 小 姐 扫 完了 你 的 所 有 物品 后 ， 计 算 机 会 显示 出 一 些 信息 ， 然 后 收银 员 小 姐 会 友 
好 地 问 你 :“ 我 们 有 一 种 一 次 性 纸杯 正在 促销 ， 位 于 ** 货 架 上 ， 您 要 购买 么 ? ”结果 你 非常 惊 
奇 地 说 :“ 啊 ， 谢 谢 你 ! 我 刚才 一 直 没 有 找到 纸杯 ”那么 计算 机 系统 如 何 知道 的 ? 秘密 在 于 
当 系统 知道 你 的 购物 车 里 面 有 餐巾 纸 、 大 瓶 可 乐 和 沙拉 的 时 候 ， 则 会 计算 出 80% 以 上 你 要 买 
一 次 性 纸杯 。 这 就 是 商业 智能 的 一 个 简单 应 用 。 

当然 ,商业 智能 的 作用 绝 不 仅 限于 此 ， 从 小 型 的 超市 系统 ， 到 国家 银行 、 航 空 、 水 利 、 
电力 、 铁 路 运输 等 大 型 系统 ， 商 业 智能 的 应 用 无 处 不 在 。 如 果 我 们 | 
对 商业 智能 做 一 个 简单 的 定义 ， 那 就 是 ， 帮助 你 把 一 些 数据 转化 成 A uw 
具有 商业 价值 的 ， 而 且 可 以 获取 的 信息 和 知识 ， 同 时 在 最 恰当 的 时 ”数据 利润 
候 ， 通 过 某 种 方式 把 信息 传递 给 需要 的 人 。 在 上 而 的 例子 中 , 计算 D g 
机 系统 把 餐巾 纸 、 大 瓶 可 乐 、 沙 拉 等 商品 信息 转化 成 具有 商业 价值 四， cse 
的 信息 5 知识 )， 同 时 在 恰当 的 时 候 把 顾客 需要 一 次 性 纸杯 的 信息 告 
诉 收银 员 ， 这 就 是 商业 智能 的 价值 。 数 据 可 以 转化 成 信息 和 知识 ， 最 后 转化 成 利润 ， 如 
1-1 所 示 。 

很 多 企业 经 过 多 年 的 企业 资源 计划 (Enterprise Resource Planning; ERP) 系统 的 运行 ， 已 
经 坐 拥 了 大 量 的 经 营 数据 ， 如 何 将 这 些 宝贵 的 数据 财富 转化 成 一 种 信息 、 知 识 传达 给 企业 管理 
者 ， 这 就 是 商业 智能 需要 研究 和 完成 的 工作 。 商 业 智能 好 像 一 个 采矿 加 工厂 ， 如 图 1-2 所 示 ; 
它 负 责 采集 大 量 的 矿石 ， 然 后 经 过 进一步 的 分 离 ， 加 工 等 操作 ， 最 后 提炼 出 高 纯度 的 精 矿 。 





















































图 1-2 采矿 加 工 图 














企业 的 经 营 和 销售 数据 就 是 这 些 未 开采 的 矿石 ， 而 商业 智能 的 作用 就 是 将 这 些 “ 矿 石 ” 
转化 成 对 企业 非 第 有 用 的 “ 精 矿 ”。 

商业 智能 对 企业 的 重要 性 是 不 诗 而 喻 的 。 它 可 以 提 局 企业 的 运营 效 京 ， 增 加 企业 的 苋 争 
力 和 领导 者 的 决策 能 力 ， 从 而 获得 更 大 的 市 场 ， 近 高 企业 的 利 调 。 同 时 为 公司 管理 层 人 员 提 
供 一 种 全 新 的 思维 方式 ， 通 过 使 用 企业 宝 贯 的 数据 财产 ， 发 现 内 部 潜在 的 规律 ， 这 样 才能 作 
出 准确 的 判断 ， 制 定 出 正确 的 决策 方针 ， 这 样 的 企业 在 苋 和 搜 中 才能 处 于 不 败 之 地 ， 同 时 也 优 
化 了 企业 内 部 的 组 织 结 构 ， 增 强 了 企业 资源 的 合理 配置 。 
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1.1.2 ”商业 智能 的 功能 


商业 智能 最 早出 现在 20 世纪 90 年 代 ， 当 时 它 的 主要 功能 就 是 查询 报表 、 数 据 分 析 、 数 
据 备 份 和 恢复 等 。 随 看 技术 的 发 展 和 应 用 的 扩展 ， 商 业 智 能 已 经 拓展 了 其 他 功能 。 

D 数据 读 取 功能 : 除了 读 取 数据 库 中 的 数据 外 ， 还 包括 一 些 平面 文件 , 例如 Excel 文件 、 
csv 文件 等 。 

2) 分 析 功 能 : 通过 业务 之 间 的 关联 关系 去 分 机 、 欣 在 事 物 发 生 的 概率 ， 例 如 通过 顾客 采 
购 的 两 品种 类 去 分 析 顾 客 需 要 纸杯 的 概率 。 

3) 红色 报警 功能 : 基于 数据 仓库 提供 报警 功能 ， 例 如 用 绿色 代表 正常 ， 红 色 代 表 超 出 了 
目标 范围 ， 提 醒 相 关 人 员 注意 。 

4) 报表 展示 的 功能 : 例如 报表 工具 (Cognos. BO 等 ) 利用 各 种 可 视 化 的 功能 呈现 给 用 
PEENIKE, WER LA 1-3) 、 散 点 图 、 线 图 、 柱 形 图 〈 见 图 1-4) ， 还 可 以 通过 问 下 和 钻 
取 、 数 据 切 片 和 旋转 以 及 交互 式 的 图 形 分 析 能 力 ， 使 用 户 能 够 从 任何 角度 去 观察 业务 。 


















































shod 销售 客 
hi 
日 第 一 季度 
国 第 二 季度 4 
口 第 三 季度 口 销售 额 
UE: ? 
0 
第 一 季度 第 二 季度 第 三 季度 第 四 季度 
图 1-3 wEB 图 1-4 柱 形 图 


1.2 ”商业 智能 的 发 展 趋势 


除了 商业 欠 能 的 一 般 功 能 ， 以 及 帮助 企业 的 管理 人 员 进 行 快速 、 准 确 的 分 机 和 决断 外 ， 
还 可 以 为 客户 提供 各 种 个 性 化 的 服务 。 例 如 ， 通 过 客户 的 特征 和 购买 的 商品 ， 可 以 进行 有 和 针 
对 性 的 促销 ， 不 仅 能 为 客 尸 提供 方便 ， 和 帮助 客户 在 最 短 的 时 间 内 购买 到 最 需要 的 商品 ， 同 时 
也 会 给 企业 市 来 直接 的 经 济 效 在 。 商 业 智 能 的 友 展 也 必然 通过 Web 和 局 域 网 的 交互 ， 在 有 效 
的 安全 体制 下 ， 实 现 决 倘 信息 和 知识 的 共 圣 。 

随 看 互联 网 的 兽 及 和 发 展 ， 商 业 智能 的 发 展 也 成 了 不 可 阻挡 的 趋势 。 企 业 可 以 通过 互联 
网 的 广泛 应 用 ， 收 集 到 更 多 的 客户 信息 和 销售 信息 ， 通 过 商业 知 能 技术 的 应 用 ， 将 这 些 数据 
转化 成 更 多 有 价值 的 信息 ， 帮 助 企业 的 决策 层 作 出 更 准确 的 分 析 和 判断 。 

中 国 是 目前 经 济 发 展 最 快 的 新 型 超级 大 国 ， 国 内 外 很 多 经 济 竺 家 部 预 测 中 国有 潜力 成 为 
和 美国 相 媲美 的 经 济 超级 大 国 和 世界 经 济 中 心 。 为 了 实现 这 个 目标 ， 中 国 很 多 制造 、 能 源 企 
业 必 将 大 力 发 展商 业 智能 技术 ， 加 大 对 商业 智能 解决 方案 的 投入 ， 从 而 降低 生产 成 本 ， 提 高 
资源 利用 紊 和 市 场 占有 率 ， 使 其 生产 运营 能 够 健康 平稳 地 发 展 。 随 看 企业 信息 化 整体 水 平 的 
提高 ， 很 多 大 型 的 ERP 公司 将 商业 智能 的 理念 租 入 到 目 且 的 系统 软件 当中 ， 这 也 必然 会 推动 
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商业 智能 的 快速 发 展 。 


1.3 ”商业 智能 的 实施 方法 和 步 又 





a ed E 之 后 ， —— 又 。 当 然 这 
坚实 施 方法 和 步 又 会 在 后 续 内 容 中 有 详细 的 介绍 , 在 这 里 读者 只 要 大 人 特 了 解 其 框架 结构 即 可 ， 
不 必 深 究 。 


1.3.1 商业 智能 的 实施 方法 


1) 项 目 规划 : 主要 包括 项 目前 期 的 准备 ， 业 务 现状 的 调研 ， 目 前 系统 的 现状 分 析 。 分 析 
内 容 包 括 业 务 需 求 的 定义 和 系统 实现 的 目标 ， 系 统 运行 环境 的 定义 ， 系 统 的 框架 结构 定义 ， 
逻辑 模型 的 设计 等 。 

2) 系统 设计 与 实现 : 主要 包括 系统 体系 结构 的 设计 ， 物 理 数 据 库 的 设计 ， 数 据 抽 取 、 转 
换 和 加 载 的 实现 ， 前 * MM 元 数据 的 管理 等 内 容 。 

3) 系统 调 优 : 指 敢 辑 、 物 理 模型 的 调整 ， 系 统 性 能 的 调 优 。 

4) 系统 运行 维护 : 指 编 写 系 统 运行 维护 手册 和 用 户 操 作 手 册 ， 培 训 教 材 等 文档 。 

商业 智能 项 目的 实施 方法 如 图 1-5 所 示 。 











项 目 规划 系统 设计 与 实现 —— 系统 运行 维护 
图 1-5 丙 业 智能 项 目的 实施 方法 


1.3.2 ”商业 智能 的 实施 步骤 


(1) 定义 需求 

需求 分 析 是 商业 智能 项 目 最 重要 的 一 步 ， 需 要 描述 项 目 背景 与 目的 、 业 务 范围 、 业 务 目 
标 、 业 务 需 求 和 功能 需求 等 内 容 ， 明 确 企业 对 商业 智能 的 期 望 和 需要 分 析 哪 些 主题 等 方面 。 

其 中 项 目 背 景 主要 描述 已 有 系统 的 当前 现状 ， 包 括 不 同 的 历史 时 期 ， 它 的 业务 需求 分 别 
是 什么 。 这 些 独立 的 信息 系统 的 特点 一 般 是 缺乏 统一 的 整体 规划 和 标准 ， 数 据 分 散 ， 每 个 业 
务 之 间 不 能 共享 信息 ， 报 表 展 示 功 能 单一 ， 各 业务 系统 之 间 存 在 数据 不 一 致 的 现象 ， 企 业 领 
J 综合 分 析 等 。 

业 智 能 项 目 最 重要 的 目的 就 是 解决 各 个 业务 系统 之 间 数 据 集中 整合 的 问题 ， 避 人 免 数 据 

不 一 o 为 企业 管理 人 员 提 供 高 效 的 数据 查询 和 强大 的 报表 展示 功能 ， 能 够 进行 多 维 
度 的 深入 分 析 和 数据 挖掘 ， 对 企业 未 来 的 经 营 状况 作出 准确 的 预测 。 

业务 范围 是 指 项 目 团队 所 有 人 员工 作 范 围 的 界定 。 

业务 目标 是 根据 调研 的 结果 ， 对 业务 需求 和 功能 需求 的 整体 和 粗略 的 概述 





























业务 需求 用 于 描述 客户 对 系统 实现 的 总 体 性 要 求 。 商 业 智 能 项 目的 特点 是 从 不 同 的 维度 
去 分 析 各 个 主题 ， 以 报表 的 形式 对 业务 进行 曾 述 。 

功能 需求 可 以 包含 各 个 业务 专题 分 析 、 关 键 性 指标 查询 和 监控 、 报 表 查 询 、 高 级 分 析 和 
数据 挖掘 等 内 容 。 

商业 智能 的 功能 框架 如 图 1-6 所 示 。 








外 部 数据 源 





(2) 数据 仓库 模型 的 建设 

模型 是 对 现实 世界 的 抽象 。 数 据 仓库 模型 是 在 需求 分 析 的 基础 上 建立 起 来 的 。 数 据 模 
型 的 设计 流程 是 : 在 系统 设计 开发 之 前 ， 业 务 人 员 和 设计 人 员 共 同 参 与 概念 模型 的 设计 ， 
核心 的 业务 概念 在 业务 人 员 和 设计 人 员 之 间 达 成 一 致 ; 在 系统 设计 开发 时 ， 业 务 人 员 和 设 
计 人 员 共 同 参 与 馆 辑 蛋 型 的 设计 ;最 后 设计 人 员 以 负 辑 模型 为 基础 进行 物理 模型 的 设计 。 
数据 模型 的 建设 将 在 后 续 划 市 中 重点 介绍 。 模 型 的 设计 流程 如 图 1-7 所 示 。 















概念 模型 设计 “逻辑 模型 设计 ”物理 模型 设计 


图 1-7 模型 的 设计 流程 


(3) 数据 抽取 、 清 洗 、 转 换 、 加 载 (ETL) 

抽取 主要 负责 将 数据 仓库 需要 的 数据 从 各 个 业务 系统 中 抽取 出 来 。 如 果 每 个 业务 系统 的 
数据 情况 各 不 相同 ， 可 能 对 每 个 数据 源 都 需要 建立 独立 的 抽取 流程 。 每 个 数据 抽取 流程 都 需 
要 使 用 接口 将 源 数 据 传送 给 下 一 阶段 的 清洗 与 转换 阶段 。 通 过 数据 抽取 程序 ， 可 以 从 业务 源 
系统 中 不 断 地 将 数据 抽取 出 来 ， 抽 取 周 期 可 以 设 定 为 某 个 固定 时 间 ， 例 如 每 天 中 午 12 点 对 源 
数据 进行 抽取 ， 也 可 以 设 定 为 某 个 时 间 间 隔 ， 例 如 每 6 个 小 时 抽取 一 次 源 数据 。 

清洗 阶段 是 对 业务 源 数 据 的 清洗 和 人 确认， 检查 抽取 的 源 数 据 质量 是 耕 达 到 数据 仓库 的 规 
定 标准 。 数 据 清洗 大 致 有 两 种 方式 。 一 是 不 同业 务 系统 间 各 上 自 专用 的 清洗 程序 ;二 是 不 同业 
































务 系统 间 有 满足 数据 仓库 清洗 需求 的 通用 程序 。 从 不 同业 务 系统 抽取 的 数据 有 可 能 存在 数据 
不 一 致 的 情况 ， 可 以 使 用 相关 规则 和 标准 检查 业 务 源 数据 的 质量 。 

转换 是 对 源 系 统 的 数据 做 最 后 一 步 的 修改 ， 包 括 对 源 数 据 的 聚合 以 及 各 种 计算 ， 是 整个 
ETL 过 程 的 核心 部 分 。 

加 载 是 将 数据 加 载 到 最 后 的 目标 表 中 ， 其 复杂 上 度 没有 转换 局 ， 一 般 采 用 批量 装载 的 形式 。 
ETL 过 程 如 图 1-8 所 示 。 


数据 抽取 》》 数据 清洗 > > 数据 转换 》》 数 据 加 载 


图 1-8 ”ETL 过 程 


数据 抽取 、 清 洗 、 转 换 、 加 载 的 相关 内 容 会 在 后 续 革 市 中 进行 详细 的 介绍 。 

(4) 建立 商业 智能 分 析 报 表 

商业 智能 分 析 报 表 通 过 对 数据 仓库 的 数据 分 析 ， 使 企业 的 高 层 领导 可 以 从 多 个 角度 奏 看 

业 的 运营 情况 ， 并 且 按 照 不 同 的 方式 去 探查 企业 内 部 的 核心 数据 ， 从 而 更 好 地 帮助 企业 决 
AR 商业 智能 实施 步骤 如 图 1-9 所 示 。 
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1.4 ALEEN HRJ 











1) 企业 高 级 领导 层 对 商业 智能 项 目的 文 持 和 雄厚 的 资金 是 项 目 成 功 的 关键 。 

2) 拥有 实力 雄厚 的 技术 团队 。 他 们 不 仅 精 通商 业 智能 相关 技术 ， 同 时 也 熟悉 相关 的 业务 
规划 和 开 友 流程 。 

3) 商业 智能 项 目 团队 的 协同 合作 能 力 。 项 目的 管理 者 需要 保证 团队 中 每 个 人 员 的 分 工 明 
确 ， 沟 通 及 时 ， 并 且 和 需要 各 部 门 之 间 有 民 好 的 合作 能 力 。 总 之 ， 丙 业 乱 能 项 目的 实施 是 一 个 
长 期 的 不 断 完 善 的 过 程 。 


























1.5 商业 鲁能 项 目的 组 织 机 构 


(1) 商业 智能 项 目 甲 方 组 织 机 构 
一 般 来 说 ， 甲 方 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 业 务 负 责 人 、 业 务 系统 负 黄 人、 


业务 部 门 代 表 、 业 务 系统 开发 商 代 表 、 软 便 件 平台 供应 商 ， 如 图 1-10 所 示 。 





业务 部 门 代表 | | 业务 系统 开发 商 代 表 | | 软 硬 件 平台 供应 商 


图 1-10 PIHEN 


(2) 商业 智能 项 目 乙 方 开 发 商 组 织 机 构 

商业 智能 项 目 乙 方 开发 商 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 需 求 定义 人 员 《包括 
需求 调研 人 员 和 需求 分 析 人 员 )、 设 计 人 员 〈 包 括 架 构 设 计 人 员 、 模 型 设计 人 员 、ETL 设计 人 
I、 报 表 设 计 人 员 )、 开 发 人 员 包括 ETL 数据 抽取 开发 人 员 、 报 表 开 发 人 员 )、 测 试 人 员 、 
BAKAR, WE 1-11 所 示 。 
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图 1-11 乙方 开发 组 织 机 构 








1.06 本章 小 结 





1) 丙 业 智能 对 企业 的 重要 性 是 不 言 而 喻 的 ， 它 可 以 提高 企业 的 运营 效率 ， 增 加 企业 的 驶 
和 争 力 和 领导 者 的 决策 能 力 ， 从 而 获得 更 大 的 市 场 ， 拓 局 企业 的 利润 。 

2) 随 看 商业 智能 的 发 展 ， 除 了 基本 的 功能 外 ， 还 扩展 了 读 取 数据 的 功能 、 分 析 功 能 和 报 
表 展 示 的 功能 。 

3) 商业 智能 拓展 的 功能 。 

e 数据 读 取 功能 : 除了 读 取 数 据 库 中 的 数据 外 ， 还 包括 一 些 平面 文件 。 

e 分 析 功 能 :通过 业务 之 间 的 天 联 关 系 去 分 析 、 探 俘 事 物 友 生 的 概率 。 

e 红色 报警 功能 : 基于 数据 仓库 提供 报警 功能 。 

e 报表 展示 的 功能 : 例如 报表 工具 (Cognos, BO 等 ) 利用 各 种 可 视 化 的 功能 呈现 给 用 

成 交叉 报表 、 人 饼 图 、 敬 点 图 、 线 图 、 和 直方 图 ， 还 可 以 通过 同 下 钻 取 、 数 据 切 片 和 旋转 
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以 及 交互 式 的 图 形 分 析 能 力 ， 使 用 户 能 够 从 任何 角度 去 观察 业务 。 

4) 随 独 互联 网 的 有 发展， 商业 智能 的 应 用 越 来 越 广泛 ， 政 府 机 构 和 企业 必 将 加 大 对 商业 智 
能 的 投资 。 

5) 商业 智能 的 实施 方法 包括 : 定义 需求 ， 数 据 仓 库 模 型 的 建设 ， 数 据 抽 取 、 清 洗 、 转 化 、 
加 载 ， 建 立 商业 智能 的 分 析 报 表 。 

6) 数据 仓库 是 商业 智能 的 基础 平台 ， 是 商业 智能 的 核心 。 

7) ETL 是 数据 抽取 (Extract) 、 转 换 〈Transform) 、 加 载 (Load ) WS, HATH 
个 项 目 ， 关 系 到 整个 项 目的 数据 质量 ， 所 以 必须 摆 放 到 十 分 重要 的 位 置 上 。 

8) 一 般 来 说 ， 甲 方 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 业 务 负 责 人 、 籽 务 系统 负责 
人 、 业 务 部 门 代表 、 业 务 系 统 开 发 丙 代 表 、 软 便 件 平台 供应 商 。 

9) 商业 智能 项 目 乙 方 开 发 商 组 织 机 构 应 该 包括 以 下 成 员 : 项 目 经 理 、 需 求 定义 人 员 【〈 包 
括 需求 调研 人 员 和 需求 分 析 人 员 )、 设 计 人 员 《【〈 包 括 架 构 设 计 人 员 、 模 型 设计 人 员 、ETL 设计 
人 员 、 报 表 设 计 人 员 )、 开 发 人 员 ( 包 括 ETL 数据 抽取 开发 人 员 、 报 表 开 发 人 员 )、 测 试 人 员 、 
BEA SEG A H o 




















s 23 学 习 丙 业 智能 之 前 的 准备 知识 


本 章 目 标 

第 1 半 对 障 业 智能 做 了 概述 性 的 介绍 ， 读 者 对 向 业 智能 已 经 有 了 大 人 履 的 了 解 。 本 章 则 重 
点 介绍 学 习 商 业 智 能 需要 的 背景 知识 ， 包 括 Oracle 数据 库 基 础 知识 ， 数 据 建 模 理 论 知 识 等 
容 ， 为 后 续 的 商业 智能 深入 学 习 打 下 坚实 的 基础 。 

PRE. KKJ: 

€ Oracle 体系 结构 。 

@ Oracle 的 优化 知识 。 

e 数据 建 模 的 理论 知识 。 

e 数据 建 模 的 流程 。 

















2.1 Oracle 体系 结构 介绍 


Oracle 数据 库 的 背景 知识 是 学 习 商 业 智 能 的 基础 。Oracle 数据 库 是 Oracle( 中 文 名 为 甲 
骨 文 ) 公司 的 产品 。Oracle 数据 库 从 推出 到 现在 只 有 短 短 的 几 十 年 ， 却 几乎 占有 了 当今 世界 
数据 库 产 品 里 50% 的 市 场 份额 。Oracle 的 历史 在 本 书 中 不 作 讲 解 。 下 面 从 Oracle 的 体系 结构 
入 手 进 行 简单 的 介绍 。 

1. 数据 库 的 定义 

一 系列 的 物理 文件 和 对 应 的 迪 辑 结构 称 为 数据 库 。 其 中 物理 文件 包括 数据 文件 、 日 忘 文 
fF. Tub. XX PA. BRAEMAR Er. KE Du. 

(1) 物理 存储 结构 

数据 文件 : 物理 存储 数据 库 的 文件 。 每 一 个 数据 文件 只 能 对 应 一 个 数据 库 ， 主 要 包括 数 
据 表 、 有 索引 和 其 他 的 段 。 

Hio: 记录 对 数据 库 的 修改 信息 ， 以 备 恢 复数 据 时 使 用 。 其 体操 作 是 每 一 个 数据 库 
至 少 包含 两 个 日 志文 件 组 ， 日 志文 件 组 以 循环 的 方式 进行 读 写 操作 ， ^v BS ACIES] NL— 
个 物理 文件 。 

控制 文件 ， 一 个 较 小 的 三 进 制 文 件 ， 用 于 描述 数据 库 的 结 
构 。 这 个 文件 会 告诉 用 户 数 据 文 件 、 临 时 文件 、 草 做 日 志文 件 
的 位 置 ， 还 包括 一 些 摘 述 性 的 信息 : 例如 数据 库 建 并 的 时 间 、 
数据 库 的 名 称 、 恢 复数 据 库 时 所 需要 的 各 种 同步 信息 等 内 容 。 

参数 文件 ， 内容 包括 确定 内 存 结构 的 大 小 、 设 置 数据 库 的 
默认 值 、 设 置 数 据 库 的 范围 、 设 置 数据 库 的 各 种 属性 、 优 化 数 
据 库 的 性 能 等 内 容 。 这 些 参数 文件 同样 会 告诉 Oracle 实例 在 什 
么 位 置 可 以 找到 控制 文件 等 。 

数据 库 的 物理 存储 结构 如 网 2-1 所 示 。 图 2-1 数据 库 的 物理 存储 结构 
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(2) 逻辑 结构 

Et: Oracle 管理 存储 空间 最 基本 的 单元 ， 也 是 最 小 的 逻辑 存储 单元 。 
区 段 ， 比 块 高 一 级 的 逻辑 存储 结构 。 区 段 由 一 系列 块 组 成 。 

B: 由 多 个 区 段 组 成 ， 区 段 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 

表 空 间 : 最 高 级 别 的 逻辑 存储 结构 。 数 据 库 就 是 由 若干 个 表 空 间 组 成 的 。 
Oracle 逻辑 结构 如 图 2-2 所 示 。 




















图 2-2 Oracle 逻辑 结构 


2. 数据 库 实例 
Oracle 实例 由 内 存 和 一 系列 后 台 进 程 组 成 。Oracle 实例 是 存储 和 控制 数据 库 的 软件 机 制 |。 
Oracle 数据 库 实例 框架 结构 如 图 2-3 所 示 。 





图 2-3 Oracle Zt VE SCIRE AR AS TJ 


(D Ja & XERE 

后 台 进 程 的 主要 功能 是 为 所 有 的 数据 库 用 户 寞 步 完 成 各 种 操作 任务 ， 从 而 保证 数据 库 的 
实际 运行 任务 正常 进行 。 

(2) 内 存 结构 

内 存 结构 主要 包括 系统 全 局 区 (SGA)、 进 程 全 局 区 (PGA)、 用 户 全 局 区 (UGA)。 

1) SGA 主要 由 3 部 分 构成 : 共享 池 、 数 据 绥 冲 区 、 日 志 绥 冲 区 .。 
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共享 池 : 由 共享 SQL 区 和 数据 字典 区 组 成 ， 参 数 shared pool size 确定 共享 池 的 大 小 。 

数据 缓冲 区 : 用 于 存储 从 数据 文件 中 读 取 的 数据 备份 和 临时 存储 数据 库 块 的 地 方 。 

HERK: 以 记录 项 的 形式 备份 到 数据 绥 冲 区 中 被 修改 的 绥 冲 块 里 ， 这 些 记 录 被 写 a 到 
日 忘 文件 中 ， 从 而 可 以 加 速 数据 库 的 操作 。 

2) PGA 主要 存储 服务 需 进 程 或 后 从 进程 的 基本 信息 。 

3) UGA 主要 存储 服务 占 会 话 有 的 基本 信息 。 














2.2 ” Oracle 优化 理论 





由 于 数据 仓库 系统 存储 大 量 的 历史 数据 和 当前 数据 ， 并 且 数 据 量 在 不断 增加 ， 为 了 提高 
数据 存储 、 检 标的 运行 效率 ， 建 立 一 个 优 民 的 数据 仓库 系统 ， 数 据 仓 库 设 计 人 员 和 开发 人 员 
需要 掌握 Oracle 优化 理论 方面 的 知识 ， 这 有 助 于 设计 、 开 发 出 高 性 能 的 数据 仓库 系统 。 


2.2.1 外 部 优化 原则 


CPU 丰 直 接 影 响 数据 库 性 能 的 外 部 因素 ， 同 时 Oracle 的 内 存 大 小 也 会 影响 SQL AWKI 
效率 ， 大 量 的 Net8 通信 同样 会 使 SQL WITEBEAEZE. 

下 而 介绍 外 部 优化 原则 的 具体 调整 方法 。 

1) 适当 增加 服务 如 CPU 的 数量 ， 服 务 占 的 性 能 会 受 CPU 的 限制 ， 最 好 的 方法 就 是 为 
服务 右 增 加 和 额外 的 CPU, 或 者 天 财 很 多 等 生 处 理 资 源 的 各 种 组 件 , 以 减少 CPU SHISBUTR TE. 

2) 当 内 存 分 足 时 ， 如 果 内 和 存 容量 人 不足， 最 好 的 方法 束 古 增加 更 多 的 内 存 ， 减 小 SGA 的 
大 小 ， 或 者 关闭 Oracle 多 线程 服务 右 ， 以 提高 数据 库 系 统 的 运行 效率 。 


2.2.2 SQL 优化 基本 规则 


1) 在 对 大 表 进 行 全 表 搜 索 时 ， 为 了 避免 不 必要 的 全 表 搜 索 而 导致 的 大 量 IO 操作 ， 最 常 
见 的 调 优 方法 是 适量 增加 索引 ， 加 快 查询 的 速度 ， 以 提高 数据 库 运 行 的 效率 。 

2) 保证 最 优 的 索引 使 用 ， 对 于 改善 查询 的 速度 和 提高 数据 库 的 性 能 是 至 关 重 要 的 。 在 某 
些 情 况 下 也 可 以 选择 多 个 索引 进行 查询 ， 还 包括 位 图 索引 和 基于 函数 索引 的 使 用 。 
2.2.3 SQL 使 用 规范 

1) 尽量 吉 免 使 用 游标 。 因 为 游标 的 效率 较 差 ， 如 果 游 标 操 作 的 数据 超过 1 万 行 ， 那 么 就 
应 该 采用 其 他 的 方法 ， 如 果 使 用 了 游标 ， 还 要 尽量 避免 在 游标 循环 中 再 进行 表 连 接 的 操作 。 

2) 不 要 在 where 子 句 中 的 “=” 左 边 进行 函数 、 算 术 运 算 或 其 他 表达 式 运 算 ， 人 否则 数据 
库 系 统 可 能 无 法 正常 使 用 索引 。 

3) 尽量 使 用 exists (RÆ select count( 关 语句 来 判断 表 中 是 侣 存在 满足 条 件 的 记录 。count 
函数 只 有 统计 表 中 所 有 行 数 时 才 使 用 ， 而 且 count(1) 或 count( X?) EE count(*) 更 有 效率 。 

4) 注意 表 之 间 关 联 字段 的 数据 类 型 ， 避 免 使 用 不 同类 型 的 字段 作为 天 联系 件 进行 多 表 连 接 。 
2.2.4 率 引 使 用 规范 


D 索引 的 创建 要 与 实际 应 用 情况 结合 考虑 ， 建 议 大 的 联机 事务 处 理 系统 (OLTP) 表 最 
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好 不 要 超过 6 个 索引 ， 以 免 系统 增加 不 必要 的 负担 。 
2) 尽 可 能 使 用 索引 字段 作为 得 询 条 件 ， 以 提高 得 询 效率 。 
3) 尽量 避免 在 大 表 碍 询 时 使 用 全 表 扫 摘 的 方式 ， 必 要 时 可 以 和 考 夸 新 建 索引 。 
4) 注意 索引 的 定期 维护 ， 可 以 周期 性 地 重建 票 引 和 重新 纺 详 存储 过 程 。 
例如 使 用 : 


SELECT 'ALTER INDEX ' || index name ||' REBUILD;' 
FROM user indexes 


语句 查询 出 当前 用 户 下 所 有 的 索引 重建 语句 ， 然 后 在 SQL 窗口 下 一 条 执行 该 重建 索引 语句 。 
2.2.5 ”临时 表 使 用 规范 


1) 尽量 避免 在 临时 表 中 使 用 distinct、order by. group by、having、join， 因 为 这 些 语 
名 会 加 重 临时 表 的 负担 。 同 时 也 尽量 避免 临时 表 的 频 索 创建 和 删除 ， 以 减少 系统 表 资 源 的 
消耗 。 

2) 在 狐 建 临时 表 时 ， 如 果 一 次 性 插入 数据 量 非常 大 ， 那 么 可 以 使 用 select into 语句 替代 
create table 语句 ， 避 免 对 日 六 的 大 量 操作 ， 可 以 缩短 运行 的 时 间 ; 如 果 数 据 量 并 不 大 ， 为 了 
绥 和 系统 表 的 资源 消耗 ， 建 议 先 创建 临时 表 ， 然 后 绸 进行 插入 操作 。 

3) 如 末 临 时 表 的 数据 量 较 大 ， 则 需要 为 临时 表 建 立 相 应 的 索引 ， 同 时 保证 数据 库 系 统 对 
该 临时 表 索 引 的 使 用 。 

4) 如 果 存 储 过 程 中 使 用 了 临时 表 ， 在 代码 的 结尾 处 ,一 定 要 将 所 有 的 临时 表 都 删除 ， 通 
第 的 做 法 是 先 执行 truncate table 语句 , 然后 再 执行 drop table 语句 ,这样 就 可 以 避免 数据 库 系 
统 较 长 时 间 锁 定 临 时 表 与 其 他 表 的 连接 查询 和 关联 ， 从 而 减轻 数据 库 系 统 的 负担 。 


2.2.6 ”索引 创建 原则 
索引 创建 原则 如 图 2-4 所 示 。 






















































定期 重建 
索引 ， 以 减 
少 索 引 的 
碎片 


索引 创 限制 每 个 


TNT 表 的 索引 
建 原则 数量 





图 2-4 索引 创建 原则 
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D Acid AX. EITRI ETE. 

2) 限制 每 个 表 的 索引 数量 ， 避 免 大 量 的 么 引导 致 数据 库 系 统 的 性 能 降低 。 

3) 为 每 个 索引 指定 表 空 间 ， 这 样 有 利于 避免 发 生 VO 冲突 。 

4) 定期 重建 沦 引 ， 以 减少 索引 的 雄 片 ， 提 局 数据 库 系统 的 性 能 。 一 般 来 襄 ， 枚 从 类 型 的 
字段 可 以 和 考 夸 使 用 位 图 索引 ， 而 非 二 又 树 突 索引 。 


2.2.7 大 数据 量 表 的 维护 原则 


D 如 果 是 超大 数据 量 的 表 ， 并 且 经 名 进行 增加 、 删 除 、 修 改 、 碍 询 等 操作 ， 最 好 的 办 法 
就 是 定期 收集 统计 信息 传递 给 Oracle 优化 器 ， 以 提高 数据 库 系 统 的 性 能 。 

2) 如 来 是 大 数据 量 的 表 ， 可 以 券 虑 使 用 按照 时 间或 者 哈 希 的 分 区 技术 ， 并 且 将 不 同 的 分 
区 放 入 到 规定 的 表 空 间 中 ， 以 提 融 数据 库 表 角 询 的 效率 。 


2.2.8 ”视图 创建 原则 


D 绝对 茶 止 在 视图 的 基础 上 再 创建 视图 ， 这 样 会 严重 影响 数据 库 的 性 能 。 

2) 推荐 使 用 物化 视图 技术 ， 以 所 融 数 据 库 表 合 询 的 效率 ,但 尽 物 化 视图 刷新 的 频率 不 能 
过 品 ， 因 为 这 样 也 会 影响 整个 数据 库 系 统 的 性 能 。 

3) 为 你 证 数据 的 一 任性 和 安全 性 ， 推 荐 将 普通 视图 设置 成 只 读 类 型 ， 不 能 做 任何 删除 操作 。 


2.2.9 代码 程序 中 使 用 索引 的 原则 


I) 尽量 少 用 in 操作 符 。 使 用 exists 替代 in 操作 符 ， 使 查询 的 子 表 能 够 使 用 索引 ， 提 高 
数据 库 表 奋 询 的 效率 。 

2) 在 where 条 件 的 后 面 尽量 不 用 二 或 !=。 例如 , 条件 count<>0 可 以 修改 成 count>0 or 
count<0， 这 样 可 以 发 挥 索 引 的 作用 ， 提 高 数据 库 表 答 询 的 效率 。 

3) like 语句 尽量 不 要 使 用 通配符 “%” 或 者 “″” ”作为 得 询 条 件 的 第 一 个 字符 。 例 如 ， 
count like '"%100%'， 这 个 条 件 会 对 数据 库 表 进行 全 表 扫 描 ， 严 重 影响 了 数据 库 表 奏 询 的 性 能 ， 
可 以 修改 成 count like '210094' or count like 3100%'， 这 样 count 字段 会 利用 该 字段 上 的 索引 进 
行 不 同 范围 的 得 询 ， 大 大 提高 了 数据 库 表 的 售 询 效率 。 

4) 因为 运算 的 字段 不 能 进行 任何 索引 ， 所 以 where 子 句 应 该 尽量 避免 在 索引 字段 上 做 任 
何 计 算 。 例 如 ，substr(count,1,3)='100' 可 以 修改 成 count like'10094'. 

5) 在 where 条 件 的 后 耐 , 一 般 将 表 连 接 语句 写 在 最 前 而 ,将 可 以 滤 挥 大 量 记录 的 条 件 写 
在 最 后 。 因 为 Oracle 进行 多 表 人 查询 时 ， 是 从 后 往 前 执行 SQL 代码 的 。 


2.2.10 ”代码 程序 中 的 一 些 建 议 


D 尽量 不 使 用 select * 语句 ， 最 好 的 办 法 是 将 要 但 询 的 字段 全 部 列 出 ， 以 提高 SQL 运行 
的 效率 。 因 为 Oracle 在 解析 的 过 程 中 ， 会 将 “*” 依次 转换 成 所 有 的 列 名 ， 这 个 工作 是 通过 
会 询 数 据 字 典 完成 的 ， 这 意味 看 将 耗费 更 多 的 时 间 和 数据 库 资源 。 

2) 尽量 多 使 用 execute immediate 语句 ， 可 以 提高 SQL 执行 的 效率 。 

3) 在 使 用 游标 时 ， 如 果 将 大 量 的 数据 集合 赋 给 游标 ， 运 行 时 一 般 会 出 现 内 存 洲 出 的 报错 
信息 。 这 时 需要 调整 绥 冲 区 的 大 小 ， 所 以 使 用 游标 时 要 注意 内 存 大 小 的 问题 。 
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4) 对 于 超大 数据 量 的 表 应 该 每 隔 一 段 时 间 执 行 一 次 收集 统计 信息 的 操作 。 例 如 ， 执 行 
dbms stats.gather table stats 命令 ， 将 统计 信息 传递 给 Oracle 优化 器 ， 以 提高 数据 库 系 统 的 
性 能 。 

5) 面 问 对 象 的 最 佳 实践 方法 是 为 每 个 属性 都 定义 一 个 get 方法 ， 但 是 不 能 把 面 癌 对 象 的 
实现 方法 应 用 于 关系 型 数据 库 中 。 关 系 型 数据 库 中 的 表 不 能 等 同 于 和 面 问 对 象 中 的 类 ， 表 中 的 
字段 同样 不 能 等 同 于 类 的 属性 ， 如 图 2-5 所 示 。 因 此 得 询 数 据 库 表 中 的 字段 时 ， 应 该 一 次 性 


全 部 取出 。 
ERRO. 
/ 


图 2-5 面向 对 象 和 关系 型 数据 库 的 关系 


6) 谋 惯 使 用 目 定 义 的 函数 。 目 定义 函数 通常 会 影响 优化 器 对 人 查询 的 优化 作用 。 

7) 检查 潢 足 某 个 条 件 的 记录 是 否 存 在 ， 绝对 不 要 使 用 select count EARRA, np EL 
VS EH] merge 语句 判断 该 记录 是 否 存 在 。 

忌 之 ， 编 写 SQL 代码 程序 的 基本 原则 是 尽 可 能 减少 数据 库 的 连接 ， 尺 量 减 少 表 之 间 的 关 
We (在 表 的 设计 过 程 中 可 以 将 第 三 范式 的 表 转 化 成 第 二 汇 式 )， 少 用 临时 表 ， 避 人 免 将 大 批量 的 
数据 分 割 成 小 块 的 数据 去 处 理 。 

此 外 ， 建 议 在 表 设 计 过 程 中 尽量 避免 使 用 BLOB、CLOB 等 大 字段 ， 因 为 这 样 做 可 能 会 
对 数据 库 的 迁移 备份 等 造成 不 必要 的 及 烦 。 


















































2.9 数据库 建 异 理 论 知识 


2.3.1 数据 库 的 数据 模型 


数据 建 模 是 指 采 用 实体 -关系 的 方法 ,用 岁 形 化 的 形式 去 摘 述 业务 规则 的 过 程 。 数 据 建 模 
主要 关注 的 是 企业 的 信息 需求 和 各 种 业务 活动 。 主 要 包括 概念 模型 设计 、 则 辑 模型 设计 和 物 
理 模 型 设计 ， 数 据 模 型 最 终 要 转化 成 数据 库存 储 的 物理 表 。 数 据 模 型 是 指 用 实体 、 实 体 的 属 
性 、 实 体 之 间 的 关系 对 企业 在 运 早 活动 中 涉及 的 所 有 业务 概念 和 业务 活动 进行 统一 的 定义 和 
描述 。 数 据 模型 是 业务 人 员 和 搁 术 开 友 人 员 之 间 沟 通 的 平台 。 

1) 概念 模型 是 一 种 高 层次 的 数据 模型 。 它 定义 了 主要 的 业务 概念 及 其 关系 ， 通 过 对 业 
务 需 求 和 调研 访谈 内 容 的 分 析 ， 对 业务 模型 进行 初步 的 归纳 和 提炼 。 概 念 模型 的 主题 域 主 
要 反映 了 企业 活动 中 某 方面 的 业务 概念 和 内 容 ， 一 般 由 同一 类 别 的 或 者 关系 较为 紧密 的 主 
题 组 成 。 主 题 是 通过 分 析 业 务 的 需求 ， 业 务 活动 的 流程 和 各 种 活动 得 到 的 。 主 题 根据 实际 
的 业务 需求 可 以 进一步 细 化 成 更 小 的 主题 或 者 实体 ， 而 实体 是 概念 模型 的 最 小 单元 ， 是 不 
可 再 分 的 。 主 题 域 、 主 题 、 实 体 以 及 它们 之 间 的 关系 组 成 了 整个 概念 模型 的 基础 架构 ， 如 
图 2-6 所 示 。 
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例如 : 人 员 基 本 信息 主题 域 由 人 员 职 位 信息 、 人 员 社 会 关系 信息 、 人 员 教 育 背 景 信息 、 
人 员 通 信 地 址 信息 、 人 员 社 会 保险 信息 等 主题 或 实体 组 成 。 
主题 域 、 主 题 和 实体 之 间 的 关系 如 图 2-7 所 示 。 




















概念 模型 
图 2-6 概念 模型 的 基础 架构 图 2-7 主题 域 、 主 题 和 实体 之 间 的 关系 


2) 逻辑 模型 是 对 概念 模型 的 进一步 分 解 和 细 化 , 描述 了 实体 、 属 性 以 及 实体 之 间 的 关系 ， 
- 般 采 用 第 三 范式 。 模 型 中 的 主要 元 素 为 主题 、 实 体 、 属 性 、 关 系 。 所 谓 主题 ， 是 指 与 业务 
相关 的 数据 主要 类 别 ;， 实体 通常 定义 为 一 个 概念 、 一 件 事 或 者 一 个 人 ， 是 唯一 的 ;属性 用 来 
描述 实体 的 特性 ， 处 于 最 低层 次 ;关系 用 来 摘 述 实体 之 间 的 业务 规则 。 例 如 : 客户 实体 包 拓 
客户 姓名 、 地 址 、 出 生日 期 等 属性 ， 客 户 姓 名 可 以 是 字符 类 型 ， 长 度 是 20。 氨 辑 模型 的 作用 
主要 有 两 点 。 一 是 便于 技术 开发 人 员 和 业务 人 员 或 者 用 户 进行 沟通 交流 ， 进 一 步 明 确 需求 。 
二 是 作为 物理 模型 设计 的 基础 ， 保 证 物理 模型 充分 满足 用 户 的 需求 。 

3) 物理 模型 在 逻辑 模型 的 基础 上 摘 述 模型 实体 的 细 攻 ， 
括 选 择 什 么 样 的 数据 库 平 台 ， 数 据 库 产品 所 对 应 的 数据 类 型 、 
上 度 、 索 引 等 因素 ， 为 逻辑 模型 选择 一 个 最 优 的 物理 存储 环境 。 
辑 模 型 转化 成 物理 模型 的 过 程 也 束 是 实体 名 转化 成 表 名 , 属性 名 
转化 成 物理 表 列 名 的 过 程 。 在 设计 物理 模型 时 , 还 需要 考虑 数据 
存储 空间 的 分 配 ， 包 括 对 列 的 属性 必须 作出 明确 的 定义 。 例 如 ; 
客户 姓名 的 数据 类 型 是 Varchar2， 长 度 是 20， 存 储 在 Oracle 数 
WEP, FHER HTZ TRAW. 

Aids ERR M t AEM EAE RRR XE 
型 、 物 理 模型 到 最 后 数据 仓库 设计 的 完成 ， 如 图 2-8 所 示 。 其 
中 概念 模型 主要 关注 业务 相关 的 核心 问题 和 核心 概念 ， 逻 辑 模 
型 主要 关注 业务 细 市 信息 ， 而 物理 模型 则 偏 章 于 数据 存储 方面 
的 技术 细节 。 数 据 模型 之 间 的 关系 如 图 2-9 所 示 。 

2.3.0 ”数据 库 建 模 的 一 般 流程 d de 
数据 建 模 的 一 般 流 程 如 下 : 

1) 数据 建 模 人 员 邀 请 业务 人 员 进 行 “ 头 脑 风暴 ”， 开 发 一 系列 可 能 的 主题 域 ， 然 后 检 碍 
所 有 的 主题 域 列表 ， 精 益 求 精 。 

2) 建立 主题 域 之 间 的 关系 ， 用 建 模 工具 画 出 最 终 的 主题 域 关系 图 。 
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3) 在 已 经 确定 的 主题 域内 ， 通 过 项 目 组 讨论 ， 以 “头脑 风暴 ”的 方式 分 析 所 有 可 能 的 主 
题 和 实体 ， 并 且 建 立 标示 符 ， 确 定 实体 和 实体 之 间 的 关系 ， 为 实体 加 入 属性 ， 其 中 实体 应 该 
有 一 个 唯一 的 名 学 ， 最 后 确定 模型 的 结构 和 内 容 。 揭 辑 模 型 的 设计 表达 了 企业 的 信息 需求 。 
4) 在 网 辑 模型 设计 完成 之 后 ， 技 术 人 员 再 根据 历 选 数据 库 产 品 的 特点 及 其 他 外 界 因素 ， 
基于 好 辑 模 型 按照 实现 技术 进行 物理 模型 的 设计 。 物 理 模 型 需要 满足 逻辑 模型 的 基本 需求 ， 
并 且 对 性 能 进行 优化 。 物 理 模 型 设计 的 最 终 目 的 就 古 将 好 辑 模 型 表达 的 信息 需求 转化 为 数据 





























库 中 的 物理 表 。 
数据 建 模 的 一 般 步 又 如 图 2-10 所 示 。 
头脑 风暴 ， 列 出 所 有 列 出 最 终 的 主题 域 列 出 主题 和 实体 ， 
可 能 的 主题 域 确定 模型 的 结构 








图 2-10 ”数据 建 模 的 一 般 步 又 


数据 建 模 流 程 如 图 2-11 所 示 。 


物理 模型 





图 2-11 数据 建 模 流 程 


2.4 kx 


10 数据 库 的 定义 : 一 系列 的 物理 文件 和 对 应 的 逻辑 结构 被 称 为 数据 库 。 
2) Oracle 框架 体系 结构 。 

e 物理 结构 : 数据 文件 、 日 志文 件 、 控 制 文件 、 参 数 文件 。 

e 系统 全 局 区 (SGA): ”共享 池 、 数 据 缓 冲 区 、 日 志 缓冲 区 。 

e 进程 : 用 户 进程 、 服 务 器 进程 、 后 台 进 程 。 
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3) Oracle 2Z 4H Zi MJ 35: 表 空 间 、 段 、 区 段 、 块 。 其 中 块 是 最 小 的 逻辑 存储 单元 ， 表 空 
间 是 最 高 级 别 的 馆 辑 存储 结构 。 
4) Oracle 优化 理论 。 
e 外 部 优化 包括 增加 CPU 的 个 数 和 内 存 的 大 小 去 调整 Oracle 的 性 能 。 
e 内 部 优化 包括 SQL 优化 的 基本 规则 、SQL 使 用 的 基本 规范 、 索 引 和 临时 表 的 使 用 规 
和 范 、 索 引 和 视 匈 的 创建 忌 则 和 代码 程序 中 的 规范 等 。 因 为 商业 智能 数据 仓库 的 数据 
量 一 般 来 说 非 党 巨大， 所 以 进行 必要 的 数据 库 优 化 是 非常 重要 的 ， 甚 至 能 决定 项 目 
的 成 败 。 
5) 索引 创建 原则 。 
e 移 插 入 数据 ， 有 再 进行 索引 的 创建 工作 。 
e 限制 每 个 表 的 索引 数量 ， 避 免 大 量 的 索引 导致 数据 库 系 统 的 性 能 降低 。 
e 为 每 个 索引 指定 表 空 间 ， 这 样 有 利于 避免 发 生 IO 冲突 。 
e 定期 重建 索引 ， 以 减少 索引 的 全 片 ， 提 高 数据 库 系 统 的 性 能 。 一 般 来 说， 枚 举 半 型 的 
字段 可 以 考虑 使 用 位 图 索引 ， 而 非 二 叉 树 类 索引 。 
6) 关系 型 数据 库 中 的 表 不 能 等 同 于 面 辐 对 象 中 的 类 ， 表 中 的 字段 同样 不 能 等 同 于 类 的 属性 。 
7) 数据 建 模 是 指 采 用 实体 -关系 的 方法 ， 用 图 形 化 的 形式 去 描述 业务 规则 的 过 程 。 数 据 
建 模 主要 关注 的 是 企业 的 信息 需求 和 各 种 业务 活动 。 主 要 包括 概念 模型 议 计 、 氨 辑 模型 设计 
和 物理 模型 设计 ， 数 据 模型 最 终 要 转化 成 数据 库存 储 的 物理 表 。 
8) 数据 库 模 型 的 设计 一 般 是 从 现实 世界 到 概 仿 模型、 逻辑 模 型 、 物 理 模型 到 最 后 数据 仓 
库 设 计 的 完成 。 
9 ) 概 念 模型 主要 关注 业务 相关 的 核心 问题 和 核心 概念 , 人 逻辑 模型 主要 关注 业务 细节 信息 ， 
而 物理 模型 则 偏重 于 数据 存储 方面 的 技术 细 届 。 
10) 数据 模型 是 数据 仓库 项 目 中 最 关键 的 技术 环节 ， 理 接 影 啊 项 目的 成 败 。 在 建 模 过 程 






















































































中 不 仅 需要 考虑 当前 的 需求 ， 更 要 为 未 来 需求 的 扩展 提供 接口 ， 从 而 满足 数据 仓库 系统 对 新 
需求 的 适应 能 


11) 数据 建 模 的 一 般 步 又 是 :头脑 风 雄 ， 列 出 所 有 可 能 的 主题 域 ， 开 会 讨论 ， 列 出 最 终 
的 主题 域 ， 列 出 主题 和 实体 ， 确 定 模 型 的 结构 ， 最 后 是 物理 表 的 设计 。 
12) 数据 建 模 的 流程 是 : 概念 模型 的 设计 、 好 辑 模 型 的 设计 、 物 理 模 型 的 设计 。 
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第 3 章 商业 智能 数据 仓库 的 理论 知识 


本 章 目 标 

通过 前 两 章 的 和 学习， 读者 已 经 大 致 了 解 了 商业 智能 的 概念 和 学 习 商业 智能 所 需要 的 六 期 
准备 知识 。 从 本 章 开 始 正 式 学 习 在 商业 智能 中 占有 重要 地 位 的 数据 仓库 理论 方面 的 知识 ， 使 
读者 了 解数 据 仓 库 的 特点 、 设 计 方 法 和 实施 的 方法 论 等 。 

学 习 本 半 后 ， 您 将 掌握 : 

e 数据 仓库 的 定义 。 

e 数据 仓库 的 特点 。 

e 数据 仓库 的 使 用 和 维护 。 

e 数据 仓库 的 组 成 部 分 。 

e 数据 仓库 的 模型 设计 。 

e 数据 集 市 的 概念 。 

e 数据 集 市 和 数据 仓库 之 间 的 关系 。 

e 数据 仓库 项 目 开 发 的 一 般 流程 。 

@ ODS 统一 信息 视图 区 的 含义 。 
































3.1 数据 仓库 的 定义 


数据 仓库 是 一 个 面 站 主题 的 、 集 成 的 、 稳 定 的 、 肥 映 历 史 变 化 的 、 随 看 时 间 的 流逝 友 生 
变化 的 数据 集合 。 它 主要 用 来 文 持 企业 管理 人 员 的 决 集 分析 。 

数据 仓库 中 面 问 主题 的 特性 是 根据 业务 的 不 同 而 进行 的 内 容 划 分 。 数 据 仓库 的 集成 特 
性 是 因为 不 同 的 业务 源 数 据 具有 不 同 的 数据 特点 ， 当 业务 源 数 据 进 入 到 数据 仓库 时 ,需要 
采用 统一 的 编码 格式 进行 数据 加 载 ， 从 而 保证 数据 仓库 中 数据 的 唯一 性 。 数 据 仓库 的 非 易 
失 性 是 指数 据 仓 库 遂 第 你 存 数 据 不 同 历史 时 期 的 各 种 状态 ， 并 不 对 数据 进行 任何 更 新 操 
作 。 数 据 仓 库 的 历史 特性 是 指数 据 你 留 时 间 鹤 字段 ， 记 录 每 个 数据 在 不 同时 间 点 内 的 各 种 
状态 。 

笔者 认为 : 数据 仓库 是 计算 机 应 用 发 展 的 必然 产物 。 它 收集 了 企业 相关 内 部 和 外 部 各 个 
业务 系统 的 数据 源 、 归 档 文件 等 一 系列 历史 数据 ， 最 后 转化 成 企业 需要 的 战略 决策 信息 。 数 
据 仓 库 技术 是 企业 应 对 市 场 油 烈 的 范 争 、 扩 大 市 场 份额 ， 提 忆 企业 利润 的 最 佳 方 有 条 之 一 。 


3.2 数据 仓库 的 特 操 


3.1 入 归纳 了 数据 仓库 的 特点 : 
e 而 问 主题 的 。 

e 集成 的 。 
76 























e 稳定 性 。 
e 反映 历史 变化 。 
数据 仓库 的 特点 如 图 3-1 所 示 。 


Ü x 
^ ~ 
MET 集成 的 
图 3-1 数据 仓库 的 特点 
下 面 将 分 别 介绍 数据 仓库 的 这 些 特点 。 
3.2.1 面向 主题 
普通 的 操作 型 数据 库 主 要 是 面向 事务 性 处 理 ， 而 数据 仓库 中 的 所 有 数据 一 般 按照 主题 进 
行 划 分 。 主 题 是 对 业务 数据 的 一 种 抽象 ， 是 从 较 高 层次 上 对 信息 系统 中 的 数据 进行 的 归纳 和 
整理 。 面 癌 主 题 的 数据 组 织 可 以 分 成 两 部 分 : 根据 原 系 统 业 务 数 据 的 特点 进行 主题 的 抽取 和 
确定 每 个 主题 所 包含 的 数据 内 容 ， 例 如 典型 的 主题 包括 : 客户 主题 、 产 品 主题 、 财 务 主题 等 ， 
而 客户 主题 包括 : 客户 茹 本 人 信息、 客户 信 用 信息 、 客 户 资 产 信息 等 内 容 。 在 分 析 数 据 仓库 主 
题 的 时 候 ， 一 般 的 方法 是 先 确定 儿 个 基本 的 主题 ， 然 后 绸 将 范围 扩大 ， 最 后 再 逐步 求 精 ， 如 


图 3-2 所 示 。 
Cmn] 
lk A 


























数据 


业务 
数据 


业务 
数据 





图 3-2 面 问 主题 的 方法 


3.22 ”集成 性 


面向 操作 型 的 数据 库 通 第 是 卉 构 的 、 并 且 相 互 独立 ， 所 以 无 法 对 信息 进行 概括 和 反映 信 
县 的 本 质 。 而 数据 仓库 中 的 数据 是 经 过 汰 数据 的 抽取 、 清 洗 、 转 换 、 加 载 得 到 的 ， 所 以 为 了 
你 证 数据 不 存在 二 义 性 ， 必 须 对 源 数据 进行 编 但 的 统一 和 必要 的 汇总 ， 以 保证 数据 仓库 内 数 
据 的 一 任性 。 数 据 仓 库 在 经 历数 据 集成 阶段 后 ， 使 数据 仓库 中 的 数据 部 遵循 统一 的 编码 规则 ， 
并 且 消 除 许多 元 余数 据 。 

集成 一 般 有 如 下 两 种 形 陈 : 
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CI) 数据 的 集成 
当 数 据 从 操作 型 数据 传 问 数 据 仓 库 时 ， 数 据 束 会 锯 集 成 ， 如 图 3-3 所 示 。 


姓名 : 张 三 
性 别 : 男 


出 生日 期 1968 年 6 月 16 日 


工作 地 点 : 北京 
婚姻 状况 : 已 婚 





姓名 : 张 三 
性 别 : B 


EZ: 张 三 
工作 地 点 ; 北京 婚姻 状况 : 已 婚 


IN 
未 


a) 





ie 性 别 ，; 男 
集成 出 生日 期 1968 年 6 月 16 日 
E 工作 地 点 ;北京 
婚姻 状况 : 已 婚 
婚姻 状况 ,已 婚 
b) 


图 3-3 ”数据 的 集成 
(2) 编码 的 集成 


当 数 据 仓 库 是 从 原 有 分 散 的 源 数 据 库 抽取 出 来 的 时 候 ， 为 了 消除 编码 的 不 一 致 性 ， 需 要 
将 这 些 来 目 不 同 数据 源 的 数据 编码 集成 起 来 ， 使 之 加 循 统 一 的 编码 规划 ， 如 图 3-4 所 示 。 





应 用 A 
性 别 m,f 
作 
据 环 
"^ 应 用 C 5 
TESI: 1,0 


图 3-4 ”编码 的 集成 


3.2.0 稳定 性 


数据 仓库 中 的 数据 反映 的 都 是 一 段 历史 时 期 的 数据 内 容 ， 它 的 主要 操作 是 查询 、 
分 析 而 不 进行 一 般 意 义 上 的 更 新 ， 一 旦 茶 个 数据 进入 到 数据 仓库 后 ， 一 般 情 况 下 数据 
会 家 长 期 保 曾 ， 当 超过 规定 的 期 限时 才 会 被 删除 。 通 单数 据 仓 库 需 要 做 的 工作 融 是 加 
载 、 碍 询 和 和 分析， 一般 不 进行 任何 修改 操作 ， 是 为 了 企业 高 层 人 员 决 策 分 析 之 用 ， 如 
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3-5 所 示 。 


操作 型 数据 库 


数据 仓库 的 


访问 ， 刷 新 





图 3-5 数据 的 加 载 


3.24 反映 历史 变化 


操作 型 数据 库 主 要 反映 菏 一 时 间 段 内 的 数据 ， 而 数据 仓库 的 目标 束 是 对 企业 的 发 展 趋 势 
作出 分 析 和 预测 。 数 据 仓库 不 断 从 OLTP 数据 库 中 获得 变化 的 数据 ， 从 而 形成 分 析 和 预测 需 
要 的 历史 数据 ， 所 以 一 般 数 据 仓 库 中 数据 表 的 键 码 痢 含 有 时 间 键 ， 以 标明 数据 的 历史 时 期 信 
恩 ， 然 后 不 断 增加 新 的 数据 内 容 。 通 党 来 说 ， 数 据 仓库 包含 的 时 间 期 限 大 概 是 5—10 年 ， 当 
超出 规定 的 期 限时 ， 需 要 删除 这 些 过 时 的 数据 。 通 过 这 些 历史 信息 可 以 对 企业 的 发 展 历程 和 
趋势 作出 分 析 和 预测 。 同 时 要 清楚 ， 数 据 仓库 的 建设 需要 大 量 的 业务 数据 作为 积累 ， 并 将 这 
些 宇 吐 的 历史 信息 经 过 加 工 、 整 理 ， 最 后 提供 给 决策 分 析 人 员 ， 这 是 数据 仓库 建设 的 根本 目 


的 ， 如 图 3-6 所 示 。 
操作 型 数据 库 数据 仓库 


。 时间 期 限 : 。 时间 期 限 : 
30~60 天 5~10 年 




















。 键 码 中 可 能 。 键 码 中 一 般 
含有 时 间 键 ， 都 含有 时 间 
也 可 能 没有 键 





图 3-6 操作 型 数据 库 和 数据 仓库 的 区 别 


3.3 ”数据 仓库 和 数据 库 的 区 别 


下 和 耐用 一 个 图 例 来 说 明 数 据 仓库 与 数据 库 的 人 不同 之 处 。 数据库 生产 系统 主要 是 面 问 
应 用 的 、 事 务 型 的 数据 处 理 ， 一般 来 说 共有 实时 性 较 蜗 ， 数 据 检索 量 较 小 ， 普 通用 户 的 
数量 较 大 等 特点 。 而 数据 仓库 系统 主要 和 面 问 主题 的 、 分 析 型 的 数据 处 理 ， 具 有 实时 性 要 
求 不 高 ， 数 据 检 索 量 较 大 ， 主 要 针对 特殊 的 用 户 群 体 (一 般 是 企业 局 层 领导 、 决 俩 分 析 
人 员 每 ;)， 用 户 的 数量 较 小 等 符 点。 其 中 事务 型 和 分 析 型 处 理 数 据 是 有 区 别 的 。 事务 型 
处 理 数 据 一 般 来 说 对 性 能 的 要 求 较为 严格 ,数据 是 事务 驱动 的 ,主要 和 面 癌 应 用 ,存储 的 
一 般 部 古 即 时 性 、 细 市 性 的 数据 ， 数 据 是 可 更 新 的 。 对 于 分 析 型 处 理 数 据 ， 一 般 来 说 ， 
对 性 能 的 要 求 较 珊 ， 数 据 是 分 析 驱 动 的 ， 主 要 和 面 回 决 集 分 析 ， 和 存储 的 一 般 部 是 历史 、 汇 
总 性 的 数据 ， 数 据 是 不 可 更 新 的 。 事 务 型 处 理 数据 和 分 析 型 处 理 数据 的 区 别 如 图 3-7 
J ZR o 
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事务 型 处 理 数 据 分 析 型 处 理 数据 


。 对 性 能 要 求 严格 。 对 性 能 要 求 较 高 
。 事 物 驱 动 的 。 分 析 驱 动 的 
。 主 要 面向 应 用 。 主 要 面向 决策 


。 主 要 存储 即时 分 析 
性 、 细 市 性 的 。 主 要 存储 历史 、 
数据 汇总 性 的 数据 
。 数 据 可 更 新 。 数 据 不 可 更 新 





图 3-7 事务 型 处 理 数 据 和 分 析 型 处 理 数据 的 区 别 
数据 库 生 产 系 统 和 数据 仓库 决策 系统 的 区 别 如 图 3-8 所 示 。 





数据 库 生产 系统 数据 仓库 决策 系统 


。 面 向 应 用 ， 事 务 处 理 。 面向 主题 ， 分 析 型 
= 实时 性 高 处 理 数据 


* 数据 检索 量 小 e 实时 性 要 求 不 高 

* 只 存储 当前 数据 e 数据 检索 量 大 

s 访问 频率 高 e 存储 大 量 的 历史 数 

e 啊 应 时 间 在 1s 以 下 据 和 当前 数据 

* 用 户 数量 很 大 s 访问 频率 中 、 低 
e 响应 时 间 为 几 种 或 更 长 
. 用 户 数量 相对 较 小 


图 3-8 ”数据 库 生 产 系 统 和 数据 仓库 决策 系统 的 区 别 


笔者 认为 : 数据 仓库 是 区 别 于 一 般 数 据 库存 储 的 为 外 一 种 数据 组 织 方式 。 它 以 面 丫 主 题 
的 形式 进行 数据 存储 ， 同 时 只 有 数据 插入 的 操作 ， 而 没有 数据 更 狐 和 删除 的 动作 。 数 据 仓 库 
实际 上 残 古 一 个 过 程 ， 而 非 条 一 个 产品 ， 不 同 的 企业 在 构建 数据 仓库 系统 的 时 候 ， 需 要 企业 
相关 业务 人 员 和 数据 仓库 开发 设计 人 员 在 各 个 部 门 的 配合 下 共同 建设 。 


3.4 ”数据 仓库 开发 过 程 介绍 

数据 仓库 开发 应 用 过 程 主要 包括 以 下 几 个 方面 : 规划 分 析 阶 段 、 设 计 实 现 阶段 、 使 用 维 
护 阶 段 。 
3.4.1 规划 分 析 阶 段 


目 完 ， 确 定数 据 仓 库 项 目的 开发 目标 。 从 用 户 角 上 度 分 析 ， 给 用 尸 提 供 哪些 决 倘 分 析 内 容 
和 功能 。 从 技术 角度 分 析 ， 在 划分 的 各 个 主题 中 需要 哪些 业务 数据 源 ， 确 定 使 用 哪 种 ETL T 
具 去 抽取 数据 ， 使 用 什么 工具 构建 数据 模型 ， 确 定数 据 仓库 的 实现 范围 ， 然 后 制订 数据 仓库 
项 目 目 标 和 工程 计划 。 























22 


其 次 ， 对 实施 数据 仓库 项 目 开发 的 所 有 预算 进行 有 效 估计 ， 编 写 详细 的 开 友 说 明 书 ， 说 
明 该 数据 仓库 系统 对 企业 发 展 的 作用 。 和 扩容 包 括 对 工作 任务 概况 的 说 明 、 重 点 文 持 该 项 目的 
业务 部 门 和 设计 开发 的 工作 计划 等 。 

再 次 ， 开 展 概 念 模型 设计 工作 。 内 容 主要 包括 用 户 需求 调研 、 午 型 的 定义 和 需求 分 析 等 
内 容 。 先 明确 用 户 的 需求 ， 然 后 在 理解 用 户 需 求 的 基础 上 ， 进 行 数 据 仓 库 概 念 模型 的 设计 ， 
还 包括 摊 号 详细 的 用 户 需 求 分 析 调 碍 表 和 针对 概念 模型 的 评审 报告 。 

最 后 ， 在 概念 异型 的 基础 上 进行 逻辑 模型 的 分 析 和 设计。 内 容 包 括 : 所 要 分 析 的 主题 域 
有 了 哪些， 主题 域 中 包含 的 主题 和 实体 有 哪些， 实体 粒度 层级 的 定义 等 内 容 。 除 此 之 外 ， 还 需 
要 撰写 逻辑 模型 的 评审 报告 和 定义 数据 仓库 的 抽取 沈 程 。 


3.4.2 ”设计 实现 阶段 


设计 阶段 主要 包括 商业 智能 项 目 体系 结构 的 设计 。 在 设计 阶段 主要 包括 数据 模型 的 
设计 ， 元 数据 的 设计 ，ETL 数据 抽取 、 转 换 、 加 载 的 设计 ， 报 表 展 现 设 计 等 内 容 。 其 中 
元 数据 包括 业务 元 数据 和 技术 元 数据 ， 它 们 之 间 的 具体 区 别 在 后 续 内 容 中 详细 介绍 。 在 
实现 阶段 ， 需 要 确定 数据 仓库 系统 选择 了 哪些 业务 数据 源 ， 实 现 从 源 系 统 中 抽取 数据 、 
消 尝 数据 、 疙 载 数据 的 设计 和 编码 过 程 ， 使 用 报表 展现 工具 开发 报表 。 在 设计 和 开发 阶 
段 选 定 建 借 工 具 ， 为 数据 仓库 十 充 测 试 数据 ， 一 般 来 说 ， 测 试 数据 需要 选择 3 年 或 者 3 
年 以 上 的 测试 数据 ， 例 如 选择 2006—2009 年 的 数据 。 商 业 智 能 项 目 体 系 结构 如 图 3-9 
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决策 分 析 层 
{i 
数据 集 市 层 m 
^ 取 
转 
换 
ili 加 
数据 缓冲 区 载 





业务 源 数 据 层 


图 3-9 商业 智能 项 目 体 系 结构 


3.4.8 ”使 用 维护 阶段 


使 用 阶段 包含 的 内 容 有 : 针对 用 户 的 培训 ， 使 用 户 明 日数 据 仓 库 的 工作 原理 ， 通 过 实际 
操作 使 用 户 浓 楚 如 何 使 用 数据 仓库 ， 数 据 仓库 可 以 实现 哪些 功能 等 。 而 数据 仓库 运 维 内 容 主 
要 包括 : 

(1) 备份 与 恢复 

数据 仓库 数据 的 定期 备份 与 恢复 是 数据 仓库 项 目 一 个 必 不 可 少 的 运 维 步 又 。 这 征 为 了 剑 
证 用 户 使 用 的 同时 ， 也 对 数据 仓库 中 的 数据 进行 妥善 处 理 ， 以 应 对 将 来 历史 数据 的 增加 和 数 
据 仓 库 规 便 的 扩大 。 











223 


(2) 数据 归档 

在 数据 仓库 项 目 中 ， 数 据 归 档 也 是 一 个 非常 重要 的 运 维 步骤 。 历 史 数 据 大 量 的 增加 使 数 
据 仓库 需要 增加 额外 的 存储 设备 来 存储 这 些 数据 ， 这 也 产生 了 额外 的 开销 。 如 何 将 这 些 海量 
的 、 历 史 细 布 性 的 数据 有 效 地 管理 起 来 ， 是 数据 仓库 运 维 过 程 中 最 重要 的 组 成 部 分 。 因 为 数 
据 量 的 不 断 增 加 ， 数 据 仓库 对 这 些 数 据 不 断 地 进行 备份 ， 不 仅 增 加 了 系统 的 复杂 度 ， 也 严重 
影响 了 系统 的 性 能 。 正 因为 如 此 ， 数 据 仓库 需 要 将 历史 细 币 性 数据 归档 到 离线 的 存储 设备 上 ， 
从 而 降低 运 维 的 难度 。 

(3) 性 能 管理 与 监控 

同 备份 与 恢复 、 数 据 归档 相 比 ， 系 统 监控 过 程 更 加 复杂 化 。 系 统 监控 包括 对 数据 库 的 监 
控 和 对 业务 系统 的 监控 。 数 据 库 的 监控 可 以 帮助 系统 管理 员 对 数据 库 系 统 进行 必要 的 优化 ， 
以 满足 未 来 日 益 增 加 的 海量 数据 容量 需求 和 对 性 能 的 要 求 。 对 业务 系统 的 监控 是 为 了 保证 数 
据 仓 库 系 统 的 正常 运行 。 性 能 是 数据 仓库 项 目 必 须要 考虑 的 问题 ， 由 于 数据 量 巨大 ， 在 设计 
过 程 中 每 个 步骤 都 需要 考虑 系统 性 能 的 问题 ， 包 括 对 数据 库 的 各 种 优化 。 性 能 管理 主要 包括 ; 
用 户 针对 业务 系统 啊 应 的 时 间 ， 文 件 传输 的 时 间 、 数 据 备份 和 恢复 的 时 间 、ETL 的 时 间 和 报 
表 展 示 的 时 间 等 方面 。 

(4) HP YI] 

培训 的 目的 是 让 用 户 对 数据 仓库 系统 的 结构 、 功 能 和 操作 流程 有 一 个 比较 清晰 的 认识 ， 
用 户 能 够 依靠 培训 手册 学 会 基本 的 操作 和 了 解 该 系统 提供 的 各 种 功能 。 在 进行 用 户 培 训 之 前 ， 
岩 要 评 细 地 列 出 培训 的 计划 和 方案 ， 例 如 列 出 本 次 培训 的 目的 、 时 间 、 日 程 和 内 容 安 排 ， 培 
训 的 人 员 等 内 容 。 

使 用 维护 阶段 如 图 3-10 所 示 。 















































图 3-10 使 用 维护 阶段 
总 结 : 数据 仓库 的 开发 周期 可 以 划分 成 规划 分 析 阶 段 、 设 计 实 现 阶段 以 及 使 用 维护 阶 
段 。 这 3 个 阶段 是 不 断 循环 和 完善 的 过 程 ， 经 过 多 次 循环 设计 、 开 发 和 改进 ， 不 断 为 系统 
增加 新 的 功能 ， 使 数据 仓库 系统 的 应 用 得 到 进一步 的 加 强 ， 同 时 为 了 保证 数据 仓库 系统 开 





发 的 有 效 进 行 ， 用 户 需 要 在 关键 步骤 中 投入 更 多 的 资源 。 数 据 仓库 系统 开发 与 应 用 的 过 程 
如 图 3-11 所 示 。 
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数据 仓库 项 目 数据 仓库 测试 数据 仓库 系统 





ELR R 数据 的 填充 的 开发 和 实施 
分 析 

gos pnta ins 数据 仓库 系统 

逻辑 模型 的 物理 模型 的 数据 仓库 系统 
设计 设计 的 维护 


数据 仓库 体系 


结构 的 设计 元 数据 的 设计 


图 3-11 数据 仓库 系统 开发 与 应 用 的 过 程 


3.5 数据 仓库 系统 组 成 部 分 介绍 


数据 仓库 系统 的 组 成 部 分 有 : 针对 数据 源 的 分 析 、 数 据 的 迁移 、 数 据 的 存储 结构 、 元 数 
据 管 理 等 。 

其 中 数据 仓库 系统 的 数据 源 分 析 是 开局 商业 知 能 项 目的 第 一 道 大 门 ， 也 是 最 基本 的 一 步 。 业 
务 系统 的 源 数 据 通 第 来 日 企业 的 内 部 信息 和 外 部 信息 。 所 谓 内 部 信息 ， 古 指 来 日 企业 的 生产 数据 
和 历史 归档 数据 。 而 企业 的 生产 数据 有 可 能 来 目 于 不 同 的 业务 系统 ， 如 何 将 这 些 业 务 数据 进行 标 
准 化 ， 转 换 成 数据 仓库 可 以 存储 的 数据 ， 从 而 你 证 数据 仓库 中 数据 的 一 任性， 这 是 数据 源 分 析 最 
重要 的 一 步 。 归 档 历 史 数 据 一 般 是 指 将 大 量 的、 不 第 用 的 历史 数据 以 在 线 的 方式 或 者 以 离线 的 方 
式 存 储 在 数据 库 中 或 者 位 市 机 中 ， 这 些 历史 数据 有 可 能 会 成 为 数据 仓库 系统 分 析 示 来 趋势 和 探究 
根本 原因 的 宝 员 财 晤 。 外 部 信息 一 般 包括 企业 的 法 律 法 规 、 访 行业 的 市 场 信息 和 该 企业 苋 争 对 手 
的 信息 ， 例 如 该 企业 苋 搜 对 手 的 市 场 占有 率 信 息 。 企 业内 部 信息 和 外 部 信息 如 图 3-12 所 示 。 

数据 的 迁移 部 分 主要 包括 数据 的 抽取 、 转 换 和 加 载 3 个 部 分 。 

数据 仓库 的 存储 与 管理 : 存储 与 管理 是 数据 仓库 的 核心 工作 。 因 为 数据 仓库 特有 的 组 织 
演 理 方式 区 别 于 传统 的 数据 库 管理 ， 它 是 按照 主题 的 形式 对 业务 源 数 据 进行 抽取 、 转 换 、 加 
载 和 集成 的 。 在 数据 仓库 中 ， 和 存储 了 大 量 的 历史 数据 ， 将 这 些 宇 贯 的 历史 数据 转换 成 可 以 分 
析 的 、 稳 定 的 数据 是 数据 仓库 的 根本 任务 和 目的 。 


企业 内 部 信息 企业 外 部 信息 


。 生 产 数据 。 法 律 法 规 






























































。 归档 数 据 e 市 场 信息 
e 企业 范 争 对 手 
的 信息 





图 3-12 企业 内 部 信息 和 外 部 信息 
元 数据 的 管理 主要 包括 技术 元 数据 和 业务 元 数据 的 管理 。 
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3.5.1. 数据 源 分 析 


数据 源 是 数据 仓库 系统 所 有 信息 的 源头 ， 主 要 是 操作 型 业务 应 用 系统 存放 的 数据 集合 。 
数据 源 分 析 是 指 对 业务 数据 产 中 的 原始 数据 进行 分 机 ， 得 到 数据 的 范围 、 格 式 ， 以 及 其 更 新 
方式 、 更 新 频率 、 质 量 等 方面 的 信息 。 商 业 智 能 系统 本 喘 束 是 一 个 数据 分 析 的 系统 ， 对 数据 
源 的 分 析 是 开局 商业 智能 项 目 大 门 的 过 程 ， 数 据 仓库 系统 需要 文 持 多 种 数据 源 格式 ， 为 了 确 
定 抽取 方式 ， 需 要 对 数据 源 进行 详细 的 分 析 。 

在 分 析 的 过 程 中 ， 需 要 确定 业务 源 数据 中 哪些 数据 需要 被 抽取 。 为 了 确定 合适 的 抽取 方 
式 ， 需 要 在 抽取 之 前 对 数据 源 进 行 分 析 ， 分 析 的 范围 一 般 包 括 数据 的 格式 、 数 据 的 范围 、 更 
狐 的 方式 、 数 据 质 量 的 好 坏 。 在 分 析 的 过 程 中 ， 应 该 尽 可 能 获取 分 析 的 结果 ， 形 成 数据 源 分 
析 报 告 ， 在 仔细 研究 分 析 报 告 后 ， 再 选择 合适 的 抽取 、 加 载 方式 。 

在 分 析 时 ， 应 该 抛弃 实际 的 应 用 系统 ， 在 馆 辑 上 重新 确定 目标 表 中 需要 哪些 业务 数据 ， 然 
后 再 根据 业务 系统 的 实现 方式 ， 分 析 业 务 源 数据 的 存储 格式 、 更 新 频率 、 更 新 方式 和 数据 质量 。 

可 以 得 出 这 样 的 结论 : 所 谓 数据 源 分 析 ， 束 是 对 庆 数 据 进行 分 机 和 总 结 ， 得 出 源 数据 的 
泄 围 、 格 式 、 更 新 方式 、 更 新 频率 和 质量 好 坏 的 过 程 。 

数据 源 分 析 的 过 程 分 为 泡 围 分 析 、 格 式 分 析 、 更 狐 方式 分 析 、 质 量 分 析 4 个 方面 ， 如 
图 3-13 所 示 。 






































更 新 方 
式 分 析 
图 3-13 ”数据 源 分 析 过 程 
1〉 泡 围 分 析 是 指 分 析 数 据 的 范围 。 用 户 需 要 确定 数据 仓库 系统 需要 数据 源 中 的 哪些 原始 
数据 。 例 如 ， 在 茶 电 力行 业 的 销售 电量 分 析 主 题 中 ， 所 有 的 数据 均 来 目 茶 管理 信息 系统 ， 由 此 
可 以 确定 ， 这 个 销售 电量 分 析 主 题 的 数据 源 都 来 目 该 管理 信息 系统 ， 可 能 是 与 这 个 管理 系统 中 
的 客户 相关 的 数据 ,或 者 与 电量 相关 的 数据 。 而 与 财务 数据 或 用 户 从 费 相 关 的 业务 数据 不 相关 。 
2) 格式 分 析 是 指 对 原始 数据 在 数据 库 中 的 物理 存储 方式 进行 分 析 。 内 容 包括 在 数据 库 中 
的 存储 类 型 、 存 储 长 度 、 数 据 精 度 等 指标 。 
3) 更 新 方式 分 析 是 指 对 诛 始 数据 在 应 用 系统 中 的 更 新 方式 、 更 新 频 率 、 更 新 内 容 进行 分 
析 判 新 。 内 容 包 括 原 始 数据 何 时 更 新 、 更 新 方 式 、 有 具体 更 新 哪些 内 容 等 。 例 如 ， 在 茶 销 售 电 
量 主题 分 析 中 ， 需 要 考虑 用 户 的 抄 表 数据 和 电量 数据 ， 一 般 都 是 每 月 增 量 更 新 的 ， 而 用 户 的 
档案 信息 也 有 可 能 进行 更 狐 , 用 户 的 从 费 信 息 也 随 独 用 户 的 缴费 行 为 而 随时 友 生 相应 的 变化 。 
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4) 质量 分 析 是 指 分 析 业 务 源 数据 的 质量 。 主 要 分 析 数 据 完 整 性 、 数 据 准 确 性 、 数 据 一 致 
性 等 内 容 。 一 般 步 又 包括 : 设计 数据 质量 定义 文档 ， 内 容 包括 数据 质量 验收 的 依据 ， 数 据 质 量 
等 级 的 划分 ， 数 据 质量 检查 的 流程 等 内 容 ， 再 根据 数据 质量 定义 文档 进行 数据 质量 检 胆 ， 节 终 
形成 质量 报告 ;根据 数据 质量 报告 进行 深入 分 机， 将 分 析 结 来 捉 交 给 相关 人 员 ， 协 助 设 二 人员 
完成 数据 请 洗 规 则 的 制定 。 通 利 ， 质 量 分 析 是 数据 源 分 析 中 最 重要 、 工 作 量 最 多 的 部 分 。 

总 结 : 除 以 上 所 述 的 对 数据 源 进行 分 析 外 ， 还 需要 对 各 项 指标 数据 的 确切 含义 ， 统 计 口 
径 等 信息 进行 明确 的 界定 ， 以 避免 产生 二 义 性 。 例 如 ， 在 销售 电量 主题 分 析 中 ， 需 要 明确 销 
售 电量 的 硝 切 含义 ， 和 是 售 包 合 线 损 电 量 、 变 损 电 量 等 。 


3.5.2 ”数据 迁移 


数据 迁移 是 商业 智能 的 重点 ， 可 以 归纳 为 如 下 3 pie 

(1) 数据 抽取 

数据 抽取 本 需要 清楚 以 下 内 容 ; 数据 源 来 日 于 哪儿 个 业务 系统 ， 各 个 业务 系统 的 数据 库 
常理 系统 分 别 是 什么 ， 有 是 否 存在 手工 录入 的 情况 。 

在 确定 数据 抽取 方式 时 ， 根 据 不 同情 况 ， 不 同业 务 源 数 据 的 抽取 方式 可 能 不 相同。 在 对 
数据 抽取 方式 进行 设计 时 ， 首 先 根据 数据 抽取 的 范围 ， 估 算出 每 次 抽取 的 数据 量 ， 然 后 再 从 
实际 的 业务 系统 数据 库 服 务 需 当前 的 运行 情况 ，ETL 服务 器 与 业务 系统 数据 库 服务 器 之 间 的 
网 络 连接 情况 ， 和 客户 对 数据 实时 性 的 要 求 等 方面 若 夸 ， 选 择 最 合适 的 抽取 方式 。 

数据 抽取 可 以 有 两 种 方式 ， 直接 抽取 方式 、 间 接 抽 取 方 式 。 

在 进行 数据 抽取 时 ， 先 明确 每 个 数据 表 采 用 何 种 数据 抽取 方式 。 直 接 抽 取 方 式 是 指数 据 
抽取 过 程 中 直接 从 业务 源 数 据 库 到 目标 库 ， 中 间 没 有 经 历 过 任何 过 渡 。 但 是 直接 抽取 方式 必 
须 确定 业务 系统 数据 库 为 ETL 过 程 提供 的 数据 库 用 户 名 、 授 权 给 该 用 户 访问 的 表 名 称 ， 对 该 
用 户 授 权 的 方式 、 数 据 抽 取 时 相关 的 安全 撞 施 等 内 容 。 间 接 抽取 方式 是 指 采 用 文件 交换 的 方 
式 进行 数据 抽取 ， 需 要 卷 展 网 络 连 接 、 数 据 库 的 分 布 等 客观 因素 。 在 文件 交换 的 过 程 中 ， 需 
要 确定 文件 交换 的 位 置 、 文 件 的 格式 、 对 文件 完整 性 的 和 检查、 文件 传输 的 方式 、 文 件 是 否 传 
得 完毕 的 标记 、 文 件 重新 传递 的 标记 等 内 容 。 间 接 抽取 方式 也 称 做 异步 ETL 方式 。 

(20 数据 转换 

数据 转换 的 售 义 古 将 业务 系统 内 的 各 种 源 数据 ， 通 过 日 定义 的 转换 脚本 或 者 其 他 一 些 计 
算 方 该 ， 将 源 数据 转换 成 符合 数据 仓库 要 求 的 数据 。 转 换 过 程 包含 了 对 数据 不 一 致 性 的 转换 ， 
数据 粒度 的 转换 和 满足 一 些 计 算 指 标的 转换 。 

如 果 转 换 的 目标 表 是 针对 数据 集 市 中 的 表 ， 那 么 当 每 一 个 字段 确定 好 转换 规则 后 ， 需 要 
对 同一 表 中 的 所 有 子 段 进行 综合 ， 以 SQL 语句 的 方式 记录 下 来 。 这 期 间 包含 了 将 业务 系统 数 
据 按 照 数据 仓库 粒度 进行 聚合 的 过 程 。 对 于 比较 复杂 的 转换 规则 ， 无 法 在 一 个 SQL 语句 中 完 
整地 表现 一 个 表 所 有 子 段 的 ， 可 以 拆 分 为 多 个 SQL 语句 。 

在 这 一 步 ， 需 要 形成 转换 规则 文档 。 内 容 包括 数据 集 市 中 的 所 有 字段 如 何 关 联 到 业务 系 
统 中 的 各 个 字段， 以 及 每 个 字段 的 运算 转换 函数 及 人 参数， 转换 的 方法 ， 还 包括 每 个 表 的 SQL 
转换 语句 等 内 容 。 

(3) TRE 
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详细 的 介绍 ， 在 此 不 再 资 述 。 


3.5.3 选择 数据 的 存储 结 


数据 库 管 理 系统 一 般 祁 提供 多 种 存储 结构 。 所 谓 数据 的 存储 结构 ， 是 指数 据 的 思 辑 结构 
在 计算 机 系统 中 的 表示 。 

设计 人 员 根 据 实际 的 需求 选择 合适 的 数据 存储 结构 , 不 同 的 存储 结构 有 不 同 的 实现 方式 ， 
各 有 人 各 有 的 特点 。 对 设计 人 员 来 说 ， 考 在 的 主要 因 系 包括 以 下 3 个 方面 : 存储 的 时 间 、 存 储 空 
间 的 利用 率 和 数据 维护 的 成 本 。 

一 般 在 ODS 数据 存储 结构 说 明 书 中 ,需要 详细 说 明 这 些 数据 采用 的 存储 结构 ， 以 及 采用 
该 存储 结构 的 原因 。 


3.5.4 ”元 数据 


元 数据 主要 包括 技术 元 数据 与 业务 元 数据 。 

(1) 技术 元 数据 

技术 元 数据 是 存储 关于 商业 知 能 系统 技术 细节 的 数据 ， 是 用 于 开发 和 管理 商业 智能 系统 
使 用 的 数据 。 它 主要 包括 以 下 信息 : 商业 智能 系统 结构 的 揪 述 ， 包 括 对 数据 产 、 数 据 转换 、 
抽取 过 程 、 数 据 加 载 东 略 以 及 对 目标 数据 库 的 定义 等 内 容 ; 还 包括 数据 仓库 使 用 的 模式 、 视 
图 、 维 度 、 层 次 结构 、 类 别 和 属性 的 定义 ， 以 及 立方 体 的 存储 模式 等 信息 。 

总 之 ， 拉 术 元 数据 提供 给 系统 演 理 人 员 和 数据 仓库 开发 人 员 使 用 ， 省 理 人 员 需 要 了 解 操 
作 环 境 到 商业 智能 环境 的 映射 天 系 〈 即 ETL 数据 抽取 的 映射 关系 )， 数 据 的 刷新 规则 ， 数 据 
的 安全 性 ， 数 据 库 优化 和 任务 调度 等 内 容 。 数 据 仓 库 开 发 人 员 需 要 了 解 度量 值 和 维度 定义 的 
算法 。 在 实际 商业 智能 开发 过 程 中 ， 业 务 元 数据 和 拉 术 元 数据 是 相互 关联 的 ， 对 元 数据 的 深 
刻 理 解 是 数据 仓库 应 用 和 维护 的 基础 。 

(2) 业务 元 数据 

业务 元 数据 从 业务 角度 揪 述 了 商业 智能 系统 中 的 数据 ， 是 介 于 使 用 者 和 真实 系统 之 间 的 
语义 层 ， 使 得 不 情 计 算 机 撤 术 的 业务 人 员 也 能 够 “理解 ”商业 智能 系统 中 的 数据 。 业 务 元 数 
据 使 用 业务 名 称 、 定 义 、 朱 述 等 信息 表示 数据 仓库 中 的 各 种 属性 和 概念 。 业 务 元 数据 主要 包 
括 以 下 信息 : 用 户 的 业务 术语 和 它们 表达 的 数据 模型 信息 、 对 和 象 名 称 及 其 属性 ， 数 据 的 来 源 
训 奶 和 数据 访问 的 规则 信息 ， 商 业 知 能 系统 提供 的 各 种 分 析 方 法 以 及 报表 展示 的 信息 。 业 务 
元 数据 使 数据 仓库 管理 人 员 和 用 户 更 好 地 理解 和 使 用 数据 仓库 ， 用 三 通过 全 看 业务 元 数据 可 
以 清晰 地 理解 各 指标 的 含义 ， 指 标的 计算 方法 等 信息 。 

元 数据 的 作用 包括 : 便于 商业 智能 系统 的 集成 和 可 重用 ， 保 证 数据 仓库 的 数据 质量 和 可 维护 
性 ， 帮 助 业务 人 员 和 技术 人 员 更 好 地 理解 当前 业务 和 系统 数据 ， 提 高 商业 智能 系统 的 管理 效率 。 

这 部 分 和 内容 在 后 续 草 丰 中 有 详细 的 介绍 ， 在 此 不 再 资 述 。 

总 结 : 房地产 业 对 我 国 经济 的 页 献 是 不 可 估量 的 。 一 是 可 以 解决 大 批 的 农民 工 残 业 问题 ，; 
二 是 为 地 方 财政 市 来 了 客观 的 收 荔 。 数据 仓库 系统 的 组 成 部 分 与 房地产 的 建设 过 程 非 闸 相似 。 
建筑 行业 的 人 都 知道 ， 大 楼 的 建设 是 很 复杂 的 ， 包 括 钢 筋 、 水 泥 、 你 温 材 料 、 下 水 道 、 燃 气 
管道 、 防 水 层 等 一 系列 的 原材料 〈 数 据 仓库 中 称 为 源 数 据 )， 经 供 货 公司 从 全 国 各 地 运送 到 建 
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的 灌 浇 过 程 ， 最 终 建 设 完成 。 数 据 仓库 与 房地产 业 的 关联 图 如 图 3-14 Bras. 





数据 仓库 


"ut 钢筋 水泥。 保温 材料 、 下 水 
数据 源 道 、 燃 气管 道 、 防 水 层 等 


数据 抽取 供 货 公司 供 货 、 运 输 


数据 转换 玻璃 的 裁剪 、 下 水 管 的 分 割 等 





E: EAE AK 
数据 加 载 ES o E 


数据 存储 HZ., E 


元 数据 设计 说 明 、 行 业 规 则 








图 3-14 ”数据 仓库 与 房地产 业 的 关联 图 


3.6 ”数据 仓库 模型 设计 介绍 





数据 模型 的 概念 在 第 1 章 中 己 经 有 了 介绍 。 数 据 模型 是 指 用 实体 、 必 性、 实体 之 间 的 关 
系 对 业务 概念 和 闽 辑 规则 进行 统一 的 定义 ， 命 名 和 编 但 ， 主 要 摘 述 企业 的 信息 需求 和 业务 规 
则 ， 古 业务 人 员 和 开发 人 员 沟 通 的 语言 ， 是 数据 仓库 染 构 设计 工作 开始 的 第 一 步 。 正 确 的 数 
据 醒 型 是 用 户 需 求 的 集中 体现 ， 是 商业 智能 项 目 成 功 与 售 最 重要 的 因素 之 一 。 数 据 模 型 可 以 
分 为 概念 模型 、 逻 辑 模 型 、 物 理 模 型 ， 本 节 进 行 详细 的 介绍 。 


3.6.1 概念 模型 


从 定义 上 来 说 ， 概 念 便 型 是 最 高 层次 的 数据 模型 ， 反 映 了 数据 仓库 的 主要 主题 和 重要 业 
务 之 间 的 关系 。 一 般 来 说 ， 在 进行 数据 仓库 系统 设计 和 开发 之 前 ， 设 计 开 发 人 员 和 业务 人 员 
己 经 对 概念 模型 达成 了 共识 ， 因 为 概念 模型 反映 的 是 核心 的 业务 问题 。 

概念 模型 的 设计 步骤 如 下 : 

1) 从 业务 需求 中 所 取 重 要 的 业务 数据 主题 , 包括 对 业务 数据 主题 的 详细 解释 ， 匈 表 3-1。 





























表 3-1 数据 主题 及 其 解释 











数据 主题 对 数据 主题 的 详细 解释 

培训 信息 人 员 进 行 各 类 培训 的 记录 
调动 信息 人 员工 作 调 动 记录 

薪酬 福利 信息 公司 人 员 薪酬 、 福 利 相 关 的 各 种 数据 
社会 保险 信息 社会 保险 分 类 定义 信息 
劳动 保障 信息 劳动 保障 分 类 定义 信息 

社保 缴纳 人 员 参 与 社会 保险 的 记录 
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2) 在 业务 数据 主题 的 基础 上 进行 数据 主题 域 的 划分 ， 包 括 对 数据 主题 域 鸣 详细 解释 ， 如 
图 3-15 所 示 。 


25 SIR Pe 
人 员 基 本 信息 





活动 中 的 人 员 和 组 织 
机 构 的 信息 


一 一 人 员 与 组 织 主 题 域 描 
人 员 培 训 信息 





人 员 职 位 信息 
a) b) 
图 3-15 人员 与 组 织 主 题 域 包括 的 信息 及 解释 
a) 人 员 与 组 织 主题 域 包括 的 信息 b) 对 人 员 与 组 织 主题 域 的 详细 解释 


3) 划分 主题 域 概 念 模型 : 根据 数据 主题 域 的 划分 ， 细 化 内 部 的 组 织 结构 和 业务 关系 ， 如 
图 3-16 所 示 。 

总 结 : 概念 模型 建 模 的 流程 大 致 可 以 分 成 如 下 几 个 部 分 : 通过 对 业务 系统 的 详细 说 明 ， 
进行 数据 的 酉 理 ， 列 出 数据 主题 详细 的 请 单 ， 并 对 每 个 数据 主题 都 作出 详细 的 解释 ， 然 后 经 
过 归纳 、 分 类 ， 整 理 成 各 个 数据 主题 域 ， 列 出 每 个 数据 主题 域 包含 哪些 部 分 ， 并 对 每 个 数据 
主题 域 作 出 详细 解释 ， 了 最 后 划分 成 主题 域 概 念 模型 ， 如 图 3-17 所 示 。 

























对 业务 系统 详细 说 明 
ia z 
e- 
W: 
: 题 域 概念 模型 
薪酬 福利 信息 ics 7 
| w o ri | 数 
E P il 
培训 信息 i 5 
图 3-16 ”划分 主题 域 概念 模型 图 3-17 ”概念 模型 设计 流程 图 


3.6.2 ”逻辑 模型 


从 定义 上 讲 ， 逻 辑 模 型 是 以 概念 模型 为 基础 ， 对 概念 模型 的 进一步 细 化 、 分 解 。 逻 辑 模 
型 通过 实体 和 实体 乙 间 的 关系 描述 业务 的 需求 和 系统 实现 的 技术 领域 ， 是 业务 需求 人 员 和 拉 
术 人 员 沟 通 的 桥 当 和 和 平台。 概念 借 型 和 所 辑 模型 的 关系 如 疼 3-18 所 示 。 

(1) 逻辑 模型 的 设计 

逻 务 模型 的 设计 是 数据 仓库 实施 中 最 重要 的 一 步 ， 因 为 它 直 接 有 反映 了 业务 部 门 的 实际 十 
求 和 业务 规则 ， 同 时 对 物理 模型 的 设计 和 实现 上 其 有 指导 作用 。 它 的 符 点 残 是 通过 实体 和 实体 
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之 间 的 关系 勾勒 出 整个 企业 的 数据 政 图 和 规划 。 效 辑 模 型 一 般 休 循 第 三 范式 ， 与 概念 模型 不 
辣 ， 它 主要 关注 细节 性 的 业务 规则 ， 同 时 需要 解决 每 个 主题 域 包含 哪些 概念 范畴 和 路 主题 域 
的 继承 和 共 诗 的 问题 。 




















逻辑 模型 


概念 模型 





人 员 与 组 织 主 题 域 | 薪酬 福利 信息 








员工 基本 信息 





职 位 可 息 x i Il 信 B. 





图 3-18 ”概念 模型 和 逻辑 模型 的 关系 

(2) 多 辑 模型 设计 的 一 般 步 又 

概念 模型 的 主题 域 一 般 是 从 企业 现 有 的 信息 系统 和 行业 目 身 业务 活动 汇总 得 来 的 业务 模 
型 主题 域 。 而 逻辑 模型 除了 在 概念 模型 的 基础 上 丰富 和 细 化 主题 域 ， 并 且 确 定 每 个 主题 域 包 
含 哪些 主题 外 ， 还 需要 以 下 几 个 步骤。 

D 分 析 和 需求 ， 列 出 需要 分 析 的 主题 ， 害 求 目 标 、 维 度 指标 、 维 度 层次 、 分 析 的 指标 、 分 
析 的 方法 、 数 据 的 来 源 、 关 注 的 对 象 等 。 例 如 ， 所 要 分 析 的 主题 是 电力 营销 业务 分 析 处 理 情 
况 ， 见 表 3-2. 




















X 3-2 电力 营销 业务 分 析 处 理 情况 





4] Wr p e 人 机 

需求 目标 按照 时 间 、 单 位 、 用 电 类 型 分 析 用 电容 量 、 用 户 数 
维度 指标 时 间 、 电 压 等 级 

维度 层次 时 间 是 年 、 季 、 月 ， 电 压 等 级 是 6kV、10kV 
分 析 的 指标 用 户 数量 、 用 电 储存 容量 
ODIA 同比 、 环 比 

数据 的 来 源 电力 营销 系统 

关注 的 对 象 公司 领导 、 中 层 管理 人 员 、 业 务 人 员 


2) 选择 用 户 感 兴趣 的 数据 ， 通 过 业务 需求 将 需要 分 析 的 指标 分 离 抽取 出 来 ， 园 化 成 迪 辑 恒 
型 需要 的 实体 。 例 如 ， 从 用 户 数量 、 用 电 储 存 容量 等 分 析 指 标 中 分 离 出 用 户 实体 和 用 电量 实体 。 

3) 在 实体 中 需要 增加 时 间 稚 属性 ， 因 为 实体 中 需要 你 存 各 个 阶段 的 历史 数据 。 通 昭 情 况 
下 ， 如 果实 体 为 统一 编码 ， 则 不 需要 增加 时 间 鹤 属性 。 

4) 需 要 考 夸 粒度 层次 的 划分 。 数 据 仓 库 的 粒度 层次 划分 直接 影响 了 数据 仓库 模型 的 设计 ， 
通 冲 细 粒度 的 数据 模型 直接 从 企业 模型 选取 实体 作为 馆 辑 模型 的 实体 ， 而 粗 粒 度 的 数据 模型 
需要 经 过 汇总 计算 得 到 相应 的 实体 。 糙 度 决定 了 企业 数据 仓库 的 实现 方式 、 性 能 、 有 灵活 性 和 
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数据 仓库 的 数据 量 。 

5) 在 粒度 层次 划分 的 基础 上 ， 还 需要 进行 关系 模 陈 的 定义 。 关 系 便 式 一 般 采 取 第 三 范式 
的 特 操 进行 定义 ， 对 当前 的 主题 进行 关系 模式 的 划分 ， 形 成 各 个 实体 、 实 体 属性 、 实 体 之 间 
的 关系 等 内 容 。 同 时 在 逻辑 模型 框架 的 基础 上 对 实体 的 中 英文 名 称 、 属 性 、 属 性 的 值 域 进行 
了 明确、 完善 和 细 化 ， 真 实 反 映 业务 锡 辑 关系 和 业务 规则 。 

逻 务 模型 的 设计 流程 图 如 图 3-19 所 示 。 











分 析 需 求 选择 感 兴趣 的 数据 ”在 实体 中 增加 时 间 戳 属性 


q2Q >U 
F TEM) 


关系 模式 的 定义 粒度 层次 的 划分 


图 3-19 ”人 逻辑 模型 的 设计 流程 图 
3.6.3 ”物理 模型 


(D 物理 模型 设计 阶段 

在 逻辑 模型 的 基础 上 ， 为 应 用 生产 环境 选取 一 个 合适 的 物理 结构 的 过 程 ， 包 括 合 适 的 存 
储 结 构 和 存储 方法 ， 称 作物 理 模 型 的 设计 过 程 。 

逻辑 模型 转变 为 物理 模型 包括 以 下 儿 个 步骤 : 

1) 实体 名 Entity) 转变 为 表 名 (Table) 。 

2) BEZ (Attribute) £s (Column) ， 确 定 列 的 属性 (Property) 。 

(2) 实现 业务 规则 

物理 模型 必须 对 列 的 属性 进行 明确 的 定义 ， 包 括 : 列 名 、 数 据 类 型 (与 特定 数据 库 管理 
系统 有 关 ) KE, ERATE AAEM, MES, WE 3-20 PR. 














军火 类 型 维 表 日 期 维 表 
军火 编码 CHAR <pk> 日 期 编码 CHAR 


(pk? 
军火 名 称 CHAR 月 份 名 称 CHAR X 





FK_ 军 火 商 销售 军火 情 _REFERENCFK_ 军 火 商 销售 军火 情 _REFERENCE _ 日 期 维 表 


军火 商 销 售 军火 情况 信息 表 
主键 ID CHAR <pk> 
日 期 编码 CHAR <fk2> 
军火 编码 CHAR <fk1> 


E CHAR 
成 本 CHAR 
利润 CHAR 





图 3-20 数据 仓库 的 物理 模型 
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物理 模型 确定 以 后 ， 可 以 进一步 确定 数据 的 存放 位 置 和 存储 空间 的 分 配 ， 最 后 生成 定义 
数据 库 的 SQL 命令 。 
概念 模型 、 远 辑 模 型 和 物理 模型 的 区 别 如 图 3-21 所 示 。 





。 最 高 层次 的 数 。 是 概念 模型 的 。 描述 模型 实体 
据 模 型 进一步 细 化 。 的 细 市 
。 定义 了 重要 的 e JETRE — 。 对 列 的 属性 进 


业务 概念 和 关 TEX 行 明确 的 定义 
A 。 描 述 实体 、 属 

。 包含 核 心 的 数 性 及 其 关系 

据 主 题 和 主题 

间 的 业务 关系 





图 3-21 概念 模型 、 风 辑 模 型 和 物理 模型 的 区 别 





3.7 ”数据 集 市 介绍 


3.7.1 数据 集 市 的 定义 


比尔 。 凋 次 次 过 :“ 如 何 搜集 、 过 理 和 利用 信息 将 决定 您 的 胜 负 ”商业 智能 正 是 
在 这 种 需求 下 诞生 的 ， 而 数据 集 市 是 满足 部 分 特殊 用 户 群 体 用 来 收集 、 管 理 他 们 本 部 
门 、 本 专业 信息 的 数据 仓库 。 大 多 数 情 况 下 ， 数 据 集 市 的 数据 来 源 于 数据 仓库 ， 是 一 
种 小 型 的 部 门 级 别 的 数据 仓库 。 数 据 集 市 的 重点 就 是 它 满足 了 东 坚 用 户 的 特殊 业务 需 
求 ， 根据 所 属 部 门 的 需求 ， 对 历史 数据 进行 必要 的 汇总 和 计 复 。 那 么 什么 是 数据 集 市 ? 
数据 集 市 束 是 满足 特定 的 部 门 或 者 用 尸 的 需求 ,按照 多 维 的 方式 进行 存储 ， 包括 定义 维 
度 、 需 要 计算 的 指标 、 维 度 的 层次 等 ， 生 成 面 癌 决 千 分 析 需 求 的 数据 立方 体 。 数 据 仓 库 
体系 结构 中 增加 了 数据 集 市 ， 数 据 集 市 可 以 看 做 是 部 门 级 的 小 型 数据 仓库 ， 如 图 3-22 
JE ZR o 












































图 3-22 ”数据 集 市 与 各 系统 之 间 的 关系 
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3.7.2 ”数据 集 市 的 类 型 


(1) 独立 型 数据 集 市 

独立 型 数据 集 市 ( 见 图 3-23) 的 数据 来 目 于 操作 型 数据 库 ， 征 为 了 满足 特殊 用 户 而 建立 
的 一 种 分 析 型 环 壕 。 这 种 数据 集 市 的 开发 周期 一 般 较 得， 具有 丈 活 性 ， 但 是 因为 胸 离 了 数据 
人 仓库， 独立 建立 的 数据 集 市 可 能 会 导致 信息 扳 铝 的 人 存在， 不 能 以 全 局 的 视角 去 分 析 数 据 。 














图 3-23 ”独立 型 数据 集 市 


(2) 从 属 型 数据 集 市 

从 属 型 数据 集 市 ( 见 图 3-24) 的 数据 来 自 于 企业 的 数据 仓库 ， 这 样 会 导致 开发 周期 的 延 
长 ,但 是 从 属 型 数据 集 市 在 体系 结构 上 比 独立 型 数据 集 市 更 稳定 ， 可 以 提高 数据 分 析 的 质量 ， 
保证 数据 的 一 致 性 。 











TBHPERRSIYAS 





3.7.3. 数据 集 市 和 数据 仓库 的 区 别 


在 数据 结构 上 ， 数 据 仓 库 古 面 疝 主题 的 、 集 成 的 数据 的 集合 。 而 数据 集 市 通 第 被 定义 为 
星 型 结构 或 者 雪 化 型 数据 结构 ， 数 据 集 市 一 般 古 由 一 张 事实 表 和 几 张 维 表 组 成 的 。 数 据 仓库 
和 数据 集 市 的 数据 结构 如 图 3-25 所 示 。 


数据 仓库 数据 集 市 














图 3-25 ”数据 仓库 和 数据 集 市 的 数据 结构 
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数据 仓库 和 数据 集 市 的 区 列 见 表 3-3。 


表 3-3 数据 仓库 和 数据 集 市 的 区 别 


数据 范围 一 般 是 部 门 级 
数据 结构 雪花 型 或 星 型 结构 
历史 数据 一 部 分 历史 数据 


3.7.4 数据 集 市 和 数据 仓库 的 关系 


数据 集 市 是 一 组 特定 的 、 针 对 茶 个 主题 域 、 东 个 部 门 或 者 东 些 特殊 用 户 而 进行 分 关 的 数 
据 集 合 ， 也 可 以 说 是 小 型 的 数据 仓库 。 用 户 可 以 在 数据 集 市 中 快速 地 对 数据 进行 访问 和 对 报 
表 进 行 展示 ， 同 时 在 数据 结构 的 内 部 对 数据 进行 必要 的 汇总 和 优化 。 数 据 集 市 的 存储 遂 津 按 
照 划 分 主题 的 形式 进行 存放 ， 其 模型 一 般 是 星 型 结构 或 者 雪花 型 结构 。 而 数据 仓库 除了 按照 
主题 的 形式 进行 存放 外 ， 其 模型 一 般 按 照 第 三 范式 的 形式 进行 设计 。 数 据 仓库 到 数据 集 市 的 
过 程 是 从 数据 规范 化 到 多 维 建 便 的 过 程 ， 包 丘 数据 仓库 内 的 实体 表 转 化 成 事实 硼 、 维 表 ， 以 
及 将 实体 之 间 的 关系 转化 成 多 维 关系 的 映射 。 在 数据 仓库 项 目 中 ， 数 据 集 市 通常 按照 地 区 、 
日 期 等 维度 对 数据 进行 组 织 和 汇总 ， 因 此 数据 仓库 转化 成 数据 集 市 也 是 按照 轻 量 级 汇总 或 者 
中 度 汇 总 和 计算 所 完成 的 。 简 而 言 乙 ， 数 据 集 市 里 的 数据 一 般 都 是 从 数据 仓库 中 经 过 转换 、 
汇总 计算 获取 的 ， 直 接 文 撑 前 中 的 应 用 需求 ， 如 图 3-26 所 示 。 效 据 集 市 的 数据 通 负 会 作为 
OLAP 服务 和 应 用 服务 的 数据 输入 。 数 据 集 市 的 数据 一 般 不 会 从 源 数据 系统 中 下 接 抽 取 ， 即 
一 般 不 提倡 建设 独立 型 的 数据 集 市 。 这 是 因为 ， 如 末 数 据 集 市 从 源 数 据 系 统 中 直接 抽取 数据 ， 
则 可 能 导 伊 数据 的 不 一 人 性 性， 同时 也 会 增加 多 个 额外 的 进程 ， 这 些 进程 在 源 系 统 中 将 大 大 省 
耗 系统 的 CPU 资源 ， 从 而 造成 资源 上 的 浪费 。 数 据 集 市 和 数据 仓库 的 关系 如 图 3-27 所 示 。 
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天 一 
客户 数据 集 市 财务 数据 集 市 
图 3-26 ”数据 集 市 的 数据 来 源 图 3-27 数据 仓库 和 数据 集 市 的 关系 
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3.7.5 ”数据 集 市 的 目标 分 析 


数据 集 市 主要 是 针对 一 组 特定 的 菏 个 主题 域 、 部 门 或 者 特殊 用 户 需 求 的 数据 集合 。 这 些 
数据 需要 针对 用 户 的 快速 访问 和 报表 展示 进行 优化 , 优化 的 方式 包括 对 数据 进行 轻 量 级 汇总 ， 
在 数据 结构 的 基础 上 创建 索引 。 数 据 集 市 的 目标 分 析 过 程 包括 对 数据 集 市 的 需求 进行 拆 分 ， 
按照 不 同 的 业务 规则 进行 组 织 ， 将 与 业务 主题 相关 的 实体 组 织 成 主题 域 ， 并 且 对 各 类 指标 进 
行 维度 分 机 ， 从 而 形成 数据 集 市 目标 说 明 书 。 内 容 包括 详细 的 业务 主题 、 业 务 主题 域 和 各 项 
站 标 及 其 分 析 维 度 。 














3.8 ”数据 仓库 实施 详细 步 又 


3.8.1 需求 分 析 


需求 分 析 是 数据 仓库 项 目 最 重要 的 一 个 环 证 ， 如 来 需求 分 析 丰 准确， 会 直接 影响 客户 的 
使 用 ， 最 终 导致 商业 智能 项 目的 失败 。 为 了 避免 最 坏 的 情况 ， 将 采取 以 下 措施 和 方法 去 完善 
需求 分 析 。 

1) 尽 可 能 与 客户 一 起 分 析 需 求 ， 引 导 客 户 将 项 目 所 要 实现 的 整体 框架 和 业务 细 克 部 分 描 
述 浓 楚 ， 最 佳 途径 就 是 需求 人 员 和 设计 人 员 通 过 原型 与 人 稳 户 讨论 ， 从 而 正确 理解 客户 实际 的 
业务 需求 。 

2) 同时 必须 实事 求 是 地 将 数据 仓库 所 能 实现 的 目标 和 不 容易 解决 的 问题 与 客户 界定 清 
楚 ， 每 一 步 的 需求 部 需要 和 客户 进行 签字 确认 。 

在 需求 讨论 的 基础 上 ， 需 要 理解 客户 的 业务 工作 流程 ， 当 然 如 采 我 们 已 经 在 这 一 行业 
中 积 素 了 丰富 的 业务 知识 ， 同 时 具备 了 引导 客户 的 能 力 ， 可 以 在 需求 调研 的 时 候 尽 可 能 地 
让 客户 按照 目 己 的 思路 去 完成 数据 仓库 系统 的 功能 设计 。 根 据 商 业 智能 项 目的 特点 ， 可 以 
将 客户 分 成 以 下 几 类 : 数据 得 询 客 户 、 报 表 奉 询 客 己 、 企 业 决 策 者 ， 通 过 与 他 们 的 沟通 交 
流 ， 帮 助 客 户 理 清 思路 ， 尽 可 能 获知 他 们 的 需求 信息 ， 同 时 需要 对 客户 讲解 数据 仓库 的 框 
染 知 识 ， 包 括 数据 仓库 的 概念 ， 数 据 仓 库 系 统 能 解决 什么 问题 ， 和 一 般 的 应 用 系统 有 什么 
区 别 。 最 好 将 以 前 成 功 的 商业 智能 项 目 讲解 给 客户 ， 使 客户 理解 处 理 当 前 数据 需要 的 时 间 
周期 ， 系 统 可 以 文 持 的 客户 访问 量 、 报 表格 式 和 展示 方式 


CMM RON MONDE H Danos 对 客户 讲解 数 
等 内 容 。 在 此 基础 上 ， 可 以 完成 商业 智能 项 目 整 体 的 规划 NIS occ 
和 对 每 一 个 开发 阶段 的 清晰 界定 。 最 后 需要 跟 客 户 沟通 的 知识 


是 在 对 数据 准确 性 的 校 验 上 ， 在 现 有 的 客观 条 件 下 ， 所 能 
保证 的 数据 仓库 系统 在 抽取 、 清 洗 、 转 换 过 程 中 允许 出 现 
的 误差 率 ， 如 图 3-28 所 示 。 

商业 智能 决策 分 析 系 统 的 实际 需求 通常 并 不 确定 ， 
为 需求 不 断 地 发 生变 化 , 这 无 形 中 增加 了 设计 者 理解 客户 图 3-28 完善 需求 分 析 的 方法 
实际 需求 的 难度 。 一 般 情况 下 ， 客 户 能 够 提供 的 都 是 需求 的 整体 框架 部 分 或 者 是 实际 需 
求 的 一 部 分 内 容 ， 不 能 预见 未 来 需要 增加 的 需求 ， 这 也 注定 了 商业 智能 决策 分 析 系 统 的 
开发 是 一 个 不 断 循环 、 反 馈 ， 使 系统 不 断 完 善 增长 的 过 程 。 同 时 ， 为 了 最 大 限度 地 减少 
了 0 


























































































































需求 变更 ， 我 们 在 需求 采集 的 过 程 中 制订 出 详细 的 调研 计 
划 ， 采 用 切实 可 行 的 调研 方式 跟 客 户 沟通 和 交流 ， 从 而 了 
解 客 户 最 真实 的 需求 。 其 中 最 篆 见 的 调研 方式 吏 是 问卷 调 
fr, ZW eA, Un 3-29 所 示 。 我 们 需 
要 充分 利用 调研 的 宝贵 时 间 ， 利 用 一 切 资 源 ， 充 分 了 解 企 
业 不 同 层 面 的 各 类 人 员 的 实际 需求 。 当 需求 完成 时 ， 和 需要 
对 采集 结果 进行 分 析 、 归 纳 、 整 理 ， 最 终 形成 完整 的 需求 
分 析 报 告 。 

业务 需求 由 实施 H TIL AE FC AE FIBRE PARRA HS RENTE 图 3-29 常见 的 调研 方式 
目标 和 企业 建立 商业 智能 系统 的 根本 目的 。 在 理解 建 记 商业 
智能 系统 目标 的 基础 上 ， 建 立 有 效 的 企业 管理 模式 ， 制 定 出 详细 的 企业 数据 仓库 业务 管理 规 
w, 设计 出 常用 的 ETL 数据 采集 规范 和 工作 流程 , 从 而 明确 商业 智能 系统 的 实施 范围 和 目标 。 
为 了 提高 企业 的 分 析 决 策 能 力 ， 可 以 利用 当下 的 局 域 网 技术 和 互联 网 技术 实现 企业 对 各 种 信 
县 的 得 询 和 分 析 ， 通 过 建立 企业 业务 数据 模型 ， 分 析 商 业 智 能 系统 的 系统 架构 ， 数 据 源 之 间 
的 差异 ， 对 数据 质量 的 评估 和 各 种 信息 的 处 理 方法 ， 有 效 地 提高 了 企业 商业 智能 系统 的 分 析 
和 决策 能 力 。 


3.8.2 ”数据 仓库 的 逻辑 分 析 


数据 仓库 在 逻辑 上 可 以 分 成 操作 型 数据 库 、 数 据 仓库 层 、 数 据 集 市 层 、 数 据 分 析 应 用 层 
和 报表 展示 层 ， 如 图 3-30 所 示 。 
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图 3-30 ”数据 仓库 的 逻辑 框 染 结 构 
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3.8.3 设计 ODS 系统 


ODS 可 以 有 两 种 形式 : ODS 数据 绥 冲 区 和 ODS 统一 信息 视图 区 。 

(1) ODS 数据 缓冲 区 

ODS 数据 缓冲 区 是 业务 数据 流动 过 程 的 第 一 个 存储 区 ， 实 现 了 数据 仓库 从 各 个 业务 系统 
的 数据 源 中 将 数据 抽取 出 来 ， 并 且 装 载 到 ODS 数据 缓冲 区 的 这 一 过 程 ， 从 而 实现 统一 的 、 全 
局 的 企业 数据 平台 ， 为 以 后 的 数据 抽取 、 清 洗 、 转 换 过 程 打 下 了 坚实 的 基础 。 对 于 数据 量 大 
的 数据 源 可 以 采用 增 量 的 方式 进行 抽取 ， 对 于 经 常 变 化 更 新 的 数据 一 般 采 用 全 量 的 方式 进行 
抽取 。ODS 数据 缓冲 区 具有 实时 性 的 特征 ，ODS 系统 将 各 个 孤立 的 业务 系统 的 生产 运营 数据 
集成 起 来 ， 组 成 统一 的 、 全 局 的 企业 数据 交换 平台 。ODS 数据 缕 冲 区 与 业务 数据 的 关系 如 
图 3-31 所 示 。 




















ODS 数据 缓冲 区 


us 8 数据 抽取 
= 


图 3-31 ODS 数据 缓冲 区 与 业务 数据 的 关系 





(2) ODS 统一 信息 视图 区 
ODS 统一 信息 视图 区 是 指 有 选择 地 集成 各 类 业务 源 数据 ， 对 数据 进行 抽取 、 清 洗 、 转 换 
操作 ， 以 数据 主题 域 为 数据 集成 的 基础 ， 对 数据 进行 分 类 和 组 织 ， 使 用 户 能 够 通过 统一 信息 
视图 区 获得 跟 某 个 主题 域 相关 的 实时 性 数据 。 各 业务 系统 和 ODS 统一 信息 视图 区 可 以 互相 访 
问 ， 可 以 生成 具有 实时 性 的 操作 性 报表 和 查询 某 一 主题 的 近期 全 部 信息 。ODS 统一 信息 视图 
区 与 各 业务 系统 之 间 的 关系 如 图 3-32 所 示 。 
各 个 业务 系统 


DO 
9E 


图 3-32 ODS 统一 信息 视图 区 与 各 业务 系统 之 间 的 关系 


(3) ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 的 区 别 和 共同 点 

ODS 数据 缓冲 区 主要 为 业务 源 数据 抽取 到 数据 仓库 中 提供 中 间 数 据 缓冲 的 功能 , 与 ODS 统一 
言 娠 视图 区 最 大 的 区 别 束 是 数据 抽取 、 清 洗 、 转 换 、 加 载 的 转换 规则 和 数据 存储 的 方式 不 同 。ODS 
统一 信息 视图 区 是 完全 按照 主题 的 方式 进行 数据 存储 ,， 回 用 户 提供 快速 的 报表 展示 和 数据 实时 奏 询 
的 功能 。 而 ODS 数据 缓冲 区 的 ETL 规则 一 般 只 进行 徐 单 的 汇总 、 计 算 ， 或 者 从 操作 型 数据 库 中 下 
接 抽取 而 中 间 不 进行 任何 转化 。ODS 统一 信息 视 网 区 的 数据 一 般 都 是 从 ODS 数据 缓冲 区 中 抽取 过 
来 的 。ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 如 图 3-33 所 示 。 
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ODS 统一 信息 视图 区 





















































ee 
ODS 数据 缓冲 区 





图 3-33 ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 


3.8.4 数据 仓库 建 模 


数据 仓库 建 便 在 前 面 已 丝 有 了 详细 的 介绍 , 数据 仓库 模型 是 IT 技术 开发 人 员 、 业 务 人 员 、 
决策 管理 者 相互 沟通 的 一 套 语言 和 平台 。 对 于 数据 建 模 工程 师 来 说 ， 对 业务 的 深刻 理解 是 站 
要 任务 ， 因 为 数据 仓库 建 模 分 为 概念 模型 设计 、 逻 辑 模型 设计 和 物理 模型 设计 3 个 阶段 ， 一 
般 投 照 目 顶 问 下 的 顺序 依次 对 模型 进行 设计 。 概 念 模型 主要 是 模型 设计 人 员 对 业务 规则 的 理 
解 ， 是 最 局 层次 的 数据 模型 ， 儿 乎 泣 瘟 了 业务 所 有 的 核心 概念 和 重要 的 主题 ， 为 以 后 逻 乞 
模型 的 建设 打下 了 基础 。 迪 辑 柑 型 是 对 概念 模型 的 分 解 、 细 化 ， 将 数据 主题 划分 成 一 个 个 
的 实体 和 实体 关系 ,一般 将 第 三 范式 作为 设计 的 模板 。 物 理 模型 在 远 辑 模型 的 基础 上 对 模 
型 实体 进行 细节 性 的 插 述 ， 包 括 子 段 类 型 、 长 有 度 、 索 引 等 因素 ， 最 后 转化 成 数据 库存 储 的 
物理 表 。 


3.8.5 ”数据 集 市 建 模 


一 般 数 据 集 市 模型 的 建设 是 基于 知 求 分 析 得 到 的 结果 ， 数 据 集 市 的 建 模 主 要 针对 事实 
表 和 维 表 的 设计 。 例 如 ， 部 门 员 工头 系 表 ， 如 末 事 实 表 包含 部 门 编 公 ， 则 数据 可 以 分 析 到 
部 门 ; 如 果 事 实 表 义 包含 员工 编码 ， 则 数据 既 可 以 分 析 到 部 门 ， 又 可 以 分 析 a 到 员工 。 一 张 
事实 表 除 了 包含 所 要 分 析 的 维度 编码 外 ， 还 包括 需要 分 析 的 硫 量 值 。 例 如 ， 用 户 用 电 分 析 
EKK LK 3-4)， 它 的 主题 描述 就 是 按 地 区 、 时 间 、 电 压 等 级 统计 用 户 的 耗 电量 、 应 收 
电费 ， 并 进行 同期 对 比 ; 它 的 维度 就 是 地 区 、 时 间 、 电 压 等 级 ， 度 量 值 包括 耗 电 量 、 应 收 
电费 等 ， 指 标 来 源 束 是 数据 仓库 中 的 计 费 结束 表 、 用 户 基 本 信息 表 。 维 表 一 般 采 用 增 量 的 
方式 进行 抽取 。 










































































表 3-4 用 户 用 电 分 析 事 实 表 





分 析 的 主题 用 户 用 电 和 情况 分 析 

需求 目标 按 地 区 、 时 间 、 电 压 等 级 统计 用 户 的 耗 电量 、 应 收 电费 ， 并 进行 同期 对 比 
维度 组 成 地 区 、 时 间 、 电 压 等 级 

分 析 的 指标 耗 电量 、 应 收 电费 

分 析 方 法 同比 、 环 比 

数据 来 源 电力 营销 系统 

指标 来 源 计 颖 结果 表 、 用 户 基 本 信息 表 
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3.8.6 ”数据 源 分 析 


通过 知 求 调研 得 知 业 务 数据 源 的 基本 情况 ， 并 且 加 以 评 细 说 明 ， 具 体内 容 包 括 数 据 源 中 
存在 哪些 物理 表 ， 表 之 间 的 关系 和 表 中 每 个 子 段 的 数据 类 型 和 含义 每 。 一 般 来 说 ， 业 务 数据 
源 可 能 存在 数据 不 完整 、 不 一 致 的 现象 ， 或 者 各 个 数据 源 存 在 业务 规则 不 统一 的 情况 。 了 解 
这 些 数据 源 的 特点 , 有 利于 ETL 抽取 时 对 数据 的 整合 和 统一 , 从 而 保证 数据 的 质量 和 可 信和 度 。 


3.8.7 ”数据 的 获取 与 整合 


数据 的 获取 与 整合 存在 于 数据 仓库 项 目 中 的 各 个 阶段 。ETL 过 程 实际 上 残 是 数据 流动 的 
过 程 ， 即 从 不 同 的 数据 源流 问 统 一 的 目标 数据 库 。 数 据 的 获取 与 整合 是 完成 数据 仓库 建设 最 
复杂 的 过 程 ， 关 系 到 数据 的 质量 ， 是 数据 仓库 项 目 建 设 的 根基 。 


3.8.8 应 用 分 析 


应 用 分 析 可 以 有 图 形 、 奉 询 列 表 、 报 表 、 文 字 报 告 等 形式 。 应 用 分 析 是 数据 仓库 辅助 诀 
策 系 统 架 构 的 最 高 层次 ， 一 般 都 是 采用 专业 的 商业 智能 工具 实现 的 。 商 业 智 能 系统 架构 图 如 
3-34 所 示 。 















































3.8.9 报表 展现 


在 商业 智能 中 ， 报 表 展 现 功能 主要 利用 第 三 方 工具 或 者 专业 的 报表 工具 对 数据 进行 展示 
和 分 析 。 报 表 工 具 不 仅 需要 文 持 多 维 分 析 ， 同 时 还 要 有 丰富 的 图 表 和 案例， 使 展现 出 来 的 数据 
不 那么 空 筒 ， 图 像 更 加 生动 ， 展 示 的 形式 更 加 多 样 化， 同时 剑 证 数据 更 加 真实 。 报 表 定 义 了 
很 多 格式 ， 可 以 通过 柱 形 图 、 饼 形 疼 等 方式 来 展现 报表 。 

例如 ， 可 以 使 用 饼 形 图 的 方式 展示 出 不 同 季 度 的 用 电容 量 情况 ， 如 疼 3-35 所 示 。 
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用 电容 量 


轩 第 一 季度 
E 第 二 季度 
O 第 三 季度 





B] 第 四 季度 


图 3-35 ”不同 季度 的 用 电容 量 


数据 仓库 的 实施 步骤 如 网 3-36 所 示 。 


es 数据 仓库 的 设计 ODS 
需求 分 析 逻辑 分 析 系统 
数据 仓库 数据 集 市 mm 
ir da 应 用 分 析 报表 展现 


图 3-36 ”数据 仓库 的 实施 步骤 


3.9 数据 仓库 的 作用 


数据 仓库 主要 有 3 个 方面 的 作用 ， 如 图 3-37 所 示 。 





数据 仓库 
的 作用 


图 3-37 数据 仓库 的 主要 作用 











1) 数据 仓库 系统 提供 了 标准 的 报表 和 图 表 展 示 功 能 ， 数 据 仓 库 内 的 数据 来 源 于 不 同 的 业 
务 处 理 系 统 ， 而 数据 仓库 系统 展示 的 数据 是 整个 企业 的 数据 集成 ， 数 据 仓 库 的 作用 就 是 利用 
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这 些 最 宝 贯 的 业务 数据 作出 最 明智 的 商业 决策 。 

2) 数据 仓库 文 持 多 维 分 析 。 多 维 分 析 通 过 把 一 个 实体 的 属性 定义 成 维度 ， 使 用 户 能 方便 
地 从 多 个 角度 汇总 、 计 算数 据 ， 增 强 了 数据 的 分 析 处 理 能 力 ， 通 过 对 不 同 维度 数据 的 比较 和 
分 机 ， 增 强 了 信息 处 理 能 力 。 多 维 分 析 是 数据 仓库 系统 在 决策 分 析 过 程 中 非常 有 用 的 一 个 功 
HE o 

3) 数据 仓库 是 数据 挖掘 技术 的 关键 和 基础 。 数 据 挖 掘 技术 是 在 已 有 数据 的 基础 上 ， 帮 助 
用 户 理解 现 有 的 信息 ， 并 且 在 当前 信息 的 基础 上 ， 对 未 来 的 企业 状况 作出 预测 ， 在 数据 仓库 
的 基础 上 进行 数据 欣 据 ， 可 以 针对 整个 企业 的 发 展 状况 和 未 来 前 景 作 出 较为 完整 、 合 理 、 谁 
确 的 分 析 和 预测 。 


























3.10 ”数据 仓库 的 建设 意义 


数据 仓库 的 建设 意义 如 下 : 

1) 使 企业 融 层 领导 能 够 从 全 局 角度 出 用 ， 推 动 企 业 数 据 的 统一 规划 ， 便 于 业务 人 员 对 企 
业 数 据 的 分 析 与 理解 。 

2) 可 以 形成 企业 的 概念 模型 ,帮助 企业 人 员 更 好 地 理解 业务 的 核心 概念 和 业务 之 间 的 天 
系 。 

3) 帮助 设计 人 员 制 定 出 更 加 合理 的 数据 架构 和 统一 的 数据 分 布 图 。 

4) 可 以 明确 各 个 业务 部 门 乙 间 的 关系 和 在 分 析 应 用 工作 中 的 主要 职责 ， 有 利于 实现 统一 
的 报表 体系 规范 ， 便 于 实现 企业 的 运营 指标 分 析 和 统一 的 口径 。 

5) 形成 有 效 的 数据 管理 体系 ， 保 证 企业 在 业务 部 门 众多 ， 内 部 数据 和 外 部 数据 复杂 的 情 
况 下 ， 数 据 只 有 唯一 事实 的 特点。 

6) 为 业务 人 员 提 供 各 种 报表 俘 询 功能 ， 为 应 用 系统 提供 强大 的 数据 分 析 功 能 。 

















3.11 zx 


1) 数据 仓库 的 定义 : 数据 仓库 是 一 个 面 癌 主题 的 、 集 成 的 、 稳 定 的 、 有 反映 历史 变化 的 数 
据 集 合 ， 用 于 文 持 管理 决策 。 数 据 仓 库 古 计算 机 应 用 发 展 的 必然 产物 ， 它 搜集 了 企业 相关 内 
部 和 外 部 各 个 系统 的 数据 源 、 归 档 文 件 等 一 系列 历史 数据 ， 包 括 大 量 原始 数据 、 业 务 数据 ， 
该 系统 用 于 构建 面向 企业 管理 者 的 决策 文 持 系统 。 

20 数据 仓库 的 特点 : 面向 主题 的 、 集 成 的 、 稳 定 的 、 反 映 历史 变化 。 

3) 数据 仓库 模型 设计 : 数据 模型 分 为 概念 便 型 、 岂 和 辑 模 型 、 物 理 模 型 。 概 念 模 型 建 模 的 
流程 大 致 可 以 分 成 如 下 几 个 部 分 : 通过 对 业务 系统 的 评 细 说 明 ， 进 行 数据 的 概 理 ， 列 出 数据 
主题 详细 的 清和 羊 ， 并 对 每 个 数据 主题 都 作出 详细 的 解释 ， 然 后 再 经过 归纳 、 分 关 ， 整 理 成 数 
据 主 题 域 ， 列 出 每 个 数据 主题 域 包含 哪些 部 分 ， 并 对 每 个 数据 主题 域 作出 解释 ， 最 后 划分 成 
主题 域 概念 模型 。 逻 辑 模型 是 以 概念 模型 为 基础 ， 对 概念 模型 的 进一步 细 化 、 分 解 。 物 理 模 
型 最 终 确 定数 据 仓 库 的 表 名 、 列 名 及 相关 属性 ， 并 生成 定义 数据 库 的 SQL 命令 。 

4) 数据 模型 是 指 用 实体 、 属 性 、 实 体 之 间 的 关系 对 业务 概 您 和 所 和 辑 规则 进行 统一 的 定义 ， 
命名 和 编码 ， 主 要 搬 述 企业 的 信息 需求 和 业务 规划 ， 是 业务 人 员 和 开发 人 员 沟 通 的 语言 ， 古 
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数据 仓库 架构 设计 工作 开始 的 第 一 步 。 正 确 的 数据 模型 是 用 户 需 求 的 集中 体现 ， 是 商业 智能 
项 目 成 功 与 否 最 重要 的 因素 之 一 。 

5) 数据 仓库 开发 过 程 包 括 : 数据 仓库 规划 分 析 与 确定 害 求 ， 概 念 模型 的 开发 ， 过 辑 模 型 
的 开发 ， 数 据 仓库 体系 结构 设计 ， 元 数据 的 设计 与 物理 表 的 实现 ， 数 据 抽 取 、 转 换 、 加 载 ， 
数据 仓库 实施 应 用 ， 数 据 仓库 维护 等 过 程 。 

6) 数据 仓库 的 价值 不 在 于 存储 数据 量 的 多 少 ， 而 是 在 于 用 户 能 从 数据 仓库 中 得 到 的 信息 
和 知识 。 

7) 在 数据 仓库 的 概念 模型 中 ， 业 务 建 模 主要 有 两 种 方式 : 

e 从 企业 的 战略 目标 出 发 ， 结 合 业务 需求 和 调研 的 内 容 ， 进 行 自 顶 向 下 开发 ， 保 证 模型 

不 偏离 商业 智能 项 目的 目标 。 
e 分 析 现 有 系统 的 数据 内 容 ， 通 过 归纳 和 总 结 ， 上 自 底 向 上 进行 概念 模型 建设 ， 即 从 数据 
的 凶 度 去 理解 业务 的 需求 和 规则 。 

8) 模型 设计 中 主要 的 议 计 元 素 有 主题 、 实 体 、 必 性、 关系 。 主 题 是 指 与 业务 相关 的 数据 
的 主要 分 类 。 主 题 域 是 企业 数据 的 主题 的 集合 ， 反 上 映 了 企业 数据 的 子 集 ， 主 要 包含 主题 、 实 
体 、 属 性 以 及 它们 之 间 的 关系 ， 是 数据 模型 中 最 大 的 逻辑 单位 。 实 体 通 党 是 一 个 人 、 一 个 地 
点 或 者 是 一 个 事件 ， 在 实体 模型 中 是 唯一 的 、 不 可 再 分 的 最 小 逻辑 单位 。 实 体 一 般 分 成 主 实 
体 、 子 实体 、 属 性 实体 、 关 系 实体 。 其 中 主 实体 是 不 依赖 于 其 他 任何 实体 而 独立 存在 的 实体 ， 
如 用 户 实 体 、 产 品 实体 每 。 子 实体 是 对 父 实体 的 逻辑 分 类 ， 一 般 继 承 父 实体 的 所 有 特征 、 属 
性 和 关系 。 

9) 数据 集 市 就 是 满足 特定 的 部 门 或 者 用 户 的 需求 ,按照 多 维 的 方式 进行 存储 ， 包 括 定 义 
维度 、 需 要 计算 的 指标 、 维 度 的 层次 等 ， 生 成 面 同 决 策 分 析 和 需求 的 数据 立方 体 。 

100 数据 仓库 和 数据 集 市 的 区 别 : 数据 仓库 是 面 问 主题 的 、 集 成 的 数据 的 集合 。 而 数据 
集 市 通常 被 定义 为 星 型 结构 或 者 雪花 型 数据 结构 ， 通 单 由 一 张 事实 表 和 几 张 维 表 组 成 。 

11) 数据 仓库 实施 详细 步 又 : 需求 分 析 、 数 据 仓库 的 逻辑 分 析 、ODS 设计 、 数 据 仓 库 建 

檬 、 数 据 集 市 建 模 、 数 据 源 分 析 、 数 据 的 获取 与 整合 、 应 用 分 析 、 报 表 展 示 。 

120. 数据 仓库 在 网 辑 上 可 以 分 成 操作 型 数据 库 、 数 据 仓 库 层 、 数 据 集 市 层 、 数 据 分 析 应 
用 层 、 报 表 展 示 层 。 

13) ODS 数据 绥 冲 区 主要 为 业务 源 数 据 抽取 到 数据 仓库 中 提供 中 间 数 据 绥 冲 的 功能 ， 与 
ODS 统一 信息 视图 区 最 大 的 区 别 就 是 数据 抽取 、 清 洗 、 转 换 、 加 载 的 转换 规则 和 数据 存储 的 
方式 不 同 。ODS 统一 信息 视图 区 是 完全 按照 主题 的 方式 进行 数据 存储 ， 癌 用户 提 供 快速 的 报 
表 展 示 和 数据 实时 查询 的 功能 。 而 ODS 数据 绥 冲 区 的 ETL 规则 一 般 只 进行 简单 的 汇总 、 计 
算 ， 或 者 从 操作 型 数据 库 中 和 直接 抽取 而 中 间 不 进行 任何 转化 。 

14) 数据 仓库 的 主要 作用 。 数 据 仓 库 主要 有 3 个 方面 的 作用 : 利用 最 宝贵 的 业务 数据 作 
出 最 明智 的 商业 决策 、 文 持 多 维 分 机 、 分 机 和 预测 功能 。 
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第 4 章 商业 


本 章 目标 
通过 前 3 半 的 和 学习， 我 们 已 经 理解 了 商业 智能 的 系统 架构 ， 对 数据 仓库 的 设计 方法 和 实 
施 的 步骤 有 了 清楚 的 认识 。 本 章 将 重点 介绍 商业 智能 ETL 方面 的 理论 知识 , 包括 ETL 的 核心 
概念 、 本 质 思 想 和 一 般 设 计 开 发 方法 等 内 容 。 本章 提 出 了 实施 数据 仓库 项 目的 ETL 方法 , ETL 
的 框架 体系 结构 ， 重 点 讲解 了 ETL 的 数据 抽取 、 转 换 、 加 载 过 程 。 
学 习 本 章 后 ， 您 将 掌握 : 
@ ETL 的 地 位 。 
ETL 的 一 般 过 程 。 
ETL 的 本 质 。 
ETL 的 体系 结构 。 
ETL 的 主流 工具 。 
ETL 的 详细 过 程 。 
ETL 的 优化 要 点 。 
ETL 的 设计 规范 。 
ETL 的 框架 结构 。 


4.1 ETL 在 数据 仓库 中 的 重要 地 位 


在 数据 仓库 系统 中 ，ETL 占有 重要 的 地 位 ，ETL 作为 一 种 数据 整合 解决 方案 ， 已 经 上 升 
到 了 一 种 理论 的 高 度 。ETL 在 数据 仓库 中 具有 以 下 几 个 特 氮 。 

1) 数据 流动 具有 周期 性 。 一 般 来 说 ， 丙 业 智 能 ETL 按照 东 种 业务 抽取 规则 周期 性 运行 ， 
每 次 运行 都 会 加 载 新 的 数据 到 目标 库 中 。 

2) 因为 数据 仓库 中 的 数据 量 巨大 ， 一 般 采 用 成 狼 的 ETL 工具 去 完成 抽取 、 转 换 、 加 载 ， 
以 降低 设计 开发 和 维护 的 复杂 上 度 , 使 设计 开发 人 员 有 更 多 的 时 间 去 专注 于 业务 转化 规则 。ETL 
是 数据 仓库 项 目 中 最 艰难 且 耗 时 最 长 的 工作 ，ETL 系统 的 设计 和 开发 工作 对 商业 智能 项 目的 
成 败 产 生 人 至 关 重 要 的 影响 ,如果 把 数据 仓库 项 目 看 成 一 座 大 厦 的 话 ， 那么 数据 模型 好 像 图 样 ， 
而 ETL 就 是 建造 这 座 大 厦 的 过 程 。 而 我 们 作为 从 事 商业 智能 的 专业 人 士 ， 需 要 真正 理解 ETL 
理论 方面 的 知识 ， 而 不 仅仅 俘 留 在 ETL 工具 的 使 用 上 ， 因 为 只 有 这样 ， 才 能 更 好 地 发 挥 它 的 
作用 。 

例如 ， 如 图 4-1 所 示 ， 建 筑 图 样 的 规划 残 是 数据 仓库 模型 的 设计 过 程 ， 根 据 图 样 建造 号 
BIENTE E ETL 设计 开发 的 过 程 ， 而 那 座 卖 丽 的 豆 怀 惑 是 数据 仓库 的 成 末 。 可 以 看 出 建造 
宫殿 的 过 程 就 是 耗 时 最 长 、 最 困难 的 工作 ， 即 ETL 是 整个 数据 仓库 项 目 中 难度 最 大 、 耗 费时 
间 最 长 的 工作 。 
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图 4-1 数据 仓库 模型 的 设计 过 程 


4.2 ETL 的 一 般 过 程 


ETL 是 数据 抽取 (Extract)、 转 换 《Transform)、 加 载 (Load ) 的 简写 。 它 的 一 般 过 程 是 
指 : 将 源 数据 抽取 出 来 ， 中 间 经 过 数据 的 清洗、 转换 ， 最 后 加 载 到 目标 表 中 。ETL 过 程 一 般 
都 是 批量 操作 的 ， 如 图 4-2 所 示 。 
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图 4-2 ETL 的 一 般 过 程 


4.3 ”研究 ETL 的 本 质 





D 用 户 应 该 理解 ETL 本 质 上 束 是 数据 从 源 到 目标 的 过 程 ( 即 数据 流动 的 过 程 )。 在 数据 
仓库 中 历史 数据 是 海量 的 ，ETL 过 程 需要 经 历 以 下 几 个 步 又: 抽取、 清洗 、 转 换 、 加 载 。 抽 
取 和 加 载 是 转换 过 程 的 输入 和 输出 部 分 ， 而 数据 转换 是 ETL 过 程 的 核心 部 分 ， 也 是 难度 最 大 
的 部 分 。 可 以 把 ETL 分 成 静态 单元 和 动态 单元 两 个 部 分 。 所 谓 静 态 单元 ， 残 是 业务 数据 转换 
的 规则 ;而 动态 单元 是 ETL 时 间 调 度 的 最 小 单位 。 目 前 有 很 多 成 熟 的 工具 都 提供 ETL 功能 ， 
包括 Informatica, Datastage. Kettle 等 。 这 些 工 具 不 但 具有 可 视 化 的 数据 流动 、 转 换 编 辑 界 面 ， 
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还 提供 各 种 转换 规则 定义 和 数据 转化 的 函数 集 。 

2) 多 数 ETL 工具 价格 昂 贯 ， 宏 观 上 一 般 都 适合 处 理 海 量 的 数据 ， 但 是 在 微观 上 需要 考 
IE ETL 处 理 的 不 同情 况 。 在 数据 量 和 复杂 上 度 都 不 高 的 情况 下 ， 可 以 利用 ETL 工具 提供 的 组 件 
指定 数据 源 和 目标 奋 ， 通 过 对 图 形 的 拖 忠 束 可 以 设 定 需 要 转换 的 规划， 操作 非常 方便 。 在 处 
理 大 数据 量 和 复杂 数据 转换 时 ， 一 般 采 用 编码 的 方式 进行 设计 和 开发 ， 更 直观 地 实现 业务 转 
换 的 规则 。ETL 工具 如 (Informatica, Datastage, Kettle) 都 是 用 图 形 界 面 去 设置 转换 规则 和 
编写 代码 程序 ， 这 和 需要 ETL 设计 开发 人 员 熟 悉 工 具 中 的 各 种 组 件 和 规则 转换 函数 ， 当 然 这 些 
ETL 工具 不 可 能 提供 所 有 的 转换 规则 ， 所 以 一 般 ETL 工具 都 提供 特定 语言 环境 (JavaScript 
语言 脚本 和 存储 过 程 的 调用 功能 ) 来 实现 高 级 转换 功能 。 

3) 元 数据 是 ETL 过 程 的 重要 体现 ， 描 述 了 数据 源 的 属性 、 数 据 源 到 目标 库 的 转换 规则 ， 
数据 抽取 的 历史 记录 等 内 容 。ETL 的 所 有 过 程 一 般 都 是 依赖 元 数据 去 实现 数据 的 清洗 、 转 换 ， 
最 后 加 载 到 目标 数据 仓库 中 ， 同 时 元 数据 也 是 数据 仓库 项 目 中 不 可 或 缺 的 部 分 。 采 用 元 数据 
方法 ， 可 以 实现 数据 抽取 流程 的 目 动 化 ， 并 且 保 证 了 数据 抽取 的 及 时 、 准 确 和 完整 。 元 数据 
的 概念 在 数据 仓库 中 非常 重要 ， ETL 中 存在 大 量 的 数据 源 定 义 和 瞻 射 规则 、 转 换 规 则 ， 这 些 
都 是 元 数据 需要 管理 和 存储 的 。 

4) 如 打 构 建 一 个 商业 智能 系统 ， 议 计 开 发 人 员 要 完全 理解 业务 数据 源 系统 是 非常 困难 
的 ， 需 要 花费 大 量 的 时 间 去 整理 数据 源 的 属性 ， 更 多 的 人 喜欢 在 ETL 开始 之 前 束 将 所 有 的 业 
务 转换 规则 弄 清楚 。 

笔者 认为 : 在 ETL 过 程 中 ， 如 和 果 遇 到 质量 有 问题 的 源 数据 ， 一 定 要 正面 对 竺 这 些 垃圾 数 
据 或 者 错误 数据 ， 是 丢弃 还 是 处 理 ， 这 些 问 题 都 是 无 法 逃避 的 。 假 设 这 些 数据 不 经 过 处 理 ， 
那么 在 ETL 过 程 中 错误 会 逐渐 放大 抛 开 数 据 产 质量 问题 , 我 们 再 来 看 看 ETL 过 程 中 哪些 因 
系 会 对 数据 的 准确 性 产生 重大 影 啊 。 

影响 ETL 数据 质量 的 关键 因素 包括 以 下 几 种 情况 : 

e 可 能 会 有 一 部 分 数据 因为 客观 或 者 人 为 的 原因 导致 数据 格式 混乱 。 

@ 源 系 统 设计 存在 不 合理 性 。 

e 在 开 友 过 程 中 ， 因 为 开发 人 员 的 错误 或 者 设计 人 员 对 业务 规则 摘 述 的 问题 ， 同 样 会 导 

致 数据 质量 出 现 问 题 。 

因为 各 种 因素 都 会 影 ETL 数据 的 质量 。 保 证 数据 质量 的 方法 有 如 下 儿 种 : 

Hoc. 用户 必须 遭 守 在 数据 仓库 项 目 中 数据 源 的 质量 要 求 ， 对 业务 源 数据 进行 仔细 分 析 ， 
以 便 对 数据 源 的 任何 错误 或 不 规范 的 地 方 有 相应 的 处 理 方 法 ， 如 对 错误 数据 舍弃 或 者 修改 。 

其 次 ， 在 保证 数据 源 的 质量 之 后 ， 在 设计 ETL 的 过 程 中 ， 对 每 一 个 步骤 都 应 该 有 一 个 衡 
量 数据 质量 的 方法 ， 需 要 重视 ETL 的 每 一 个 过 程 。 对 于 有 误差 的 数据 ,需要 退 洲 到 根本 原因 ， 
并 且 将 数据 仓库 的 模型 与 数据 质量 的 验证 方法 统一 起 来 ， 实 现 每 一 步 的 ETL 过 程 都 有 验证 数 
据 质量 的 脚本 。 

最 后 ， 残 是 规范 业务 流程 ， 保 证 ETL 的 正确 性 ， 避 免 误 删 数 气 或 者 重复 加 载 业 务 数据 。 

其 中 对 质量 的 衡量 有 下 和 面 儿 种 方式 ， 如 图 4-3 Pros. 

1) 定义 的 数据 是 否 和 实际 数值 相同 。 例 如 ， 一 个 数据 项 “客户 来 电 每 候 率 ”是 摘 述 在 客 
户 服务 中 ， 客 人 来 电 等 候 的 时 间 超 过 Imin 的 次 数 / 客 人 来 电 的 总 次 数 。 随 看 客户 服务 质量 的 
提高 ， 客 人 来 电 等 候 率 会 发 生变 化 ， 当 客人 来 电 等 候 的 时 间 超 过 lmin 的 次 数 减 少时 ， 客 户 来 
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电 等 候 率 也 会 相应 降低 ， 但 是 如 果 这 个 值 没 有 衫 更 新 ， 那 么 该 数值 可 能 是 不 正确 的 。 

2) 指标 数据 是 否 符 合 业 务 的 规则 。 例 如 ,“ 社 会 你 险 闫 别 ” 是 描述 社会 你 险 分 关 的 信息 ， 
不 包括 劳动 保障 类 别 里 的 内 容 ， 这 个 指标 如 来 出 现 劳 动 你 障 类 别 里 的 信息 ， 束 表明 该 指标 违 
育 了 业务 规则 。 

3) 数据 是 否 和 业务 源 系 统 中 的 信息 保持 一 致 。 该 数据 和 源 系 统 中 公认 的 、 权 威 性 的 信息 
必须 你 持 一 致 ， 含 则 该 数值 可 能 是 不 正确 的 。 例 如 ， 发 票 中 的 公司 名 称 必 须 和 公司 注册 的 名 
称 剑 持 一 人 致 ， 公 司 涉 及 的 所 有 紧 括 名 称 必 须 和 公司 合同 里 的 名 称 保持 一 发， 否则 该 数值 可 能 
不 正确 。 

4) 数据 是 否 违背 自然 规律 或 者 不 符合 常理 。 如 果 数 据 与 业务 源 系统 中 公认 的 、 权 威 性 的 
言 恩 你 持 一 致 ， 但 是 却 违 育 了 目 然 规 律 或 者 不 符合 利 理 ， 同 样 应 该 分 析 该 数据 是 合 正 确 。 



































定义 的 数据 是 否 和 实际 数值 相同 
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违背 自然 规律 或 者 不 符合 常理 











图 4-3 ”对 质量 的 衡量 方式 


4.4 ETL 的 体系 结构 


ETL 的 体系 结构 如 图 4-4 所 示 。 





图 4-4 ETL 的 体系 结构 


4.5 ”ETL 的 难点 





笔者 认为 : 数据 仓库 项 目 中 必须 要 解决 的 问题 ， 吏 是 多 个 源 数据 中 可 能 存在 数据 不 一 至 
的 问题 ， 这 残 需要 有 统一 的 编 权 ， 将 不 同 源 的 数据 根据 统一 的 编码 进行 规范 ， 统 一 抽取 到 数 
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据 仓 库 中 ， 而 数据 仓库 将 保证 数据 是 一 致 的 ， 不 会 存在 二 义 性 ， 这 也 是 ETL 的 难点 和 重点 。 


4.6 ”主流 的 ETL 工具 








选择 合适 的 ETL 工具 是 实际 数据 仓库 项 目 中 必须 要 考虑 的 问题 ， 包 括 使 用 成 本 、 技 术 人 
员 对 此 工 其 的 熟练 程度 、ETL 工具 开发 商业 智能 项 目的 成 功 案 例 和 工具 厂商 强 有 力 的 技术 文 
持 。 在 实际 项 目 中 ， 最 单 用 的 工具 束 是 PowerCenter 和 Datastage， 一 些 公司 其 至 也 用 开源 的 
ETL 工具 ， 如 Kettle. 

从 本 质 上 来 说 ，ETL 工具 的 功能 都 是 相同 的 ， 都 提供 了 一 个 全 面 的 数据 集成 解决 方案 。 
ETL 工具 的 功能 如 图 4-5 Pros « 


ETL 工具 的 功能 
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图 4-5 ETL 工具 的 功能 


ETL 工具 可 以 使 用 通用 的 接口 JDBC. ODBC 或 者 自己 厂商 的 专用 接口 去 抽取 源 数据 ， 











实现 了 ETL 对 不 同 数据 源 的 文 持 。 

数据 转换 是 ETL 工具 提供 的 最 强大 的 功能 ， 也 是 ETL 开发 人 员 面 临 的 难度 最 大 的 问题 。 
一 般 来 说 ，ETL 工具 提供 了 各 种 组 件 来 实现 不 同 的 转换 功能 ， 有 行列 转换 、 过 滤 、 排 序 、 汇 
忌 、 分 组 、 计 算 等 第 用 的 转换 方式 ; 同时 可 以 实现 代理 主键 的 生成 ，Mapping 的 调试 功能 ， 
抽取 远程 源 数 据 ， 各 种 数据 增 量 加 载 方 式 ， 在 转换 过 程 中 还 可 以 文 持 数据 比较 、 类 型 转换 、 
字段 拆 分 等 功能 ， 数 据 预 览 ， 数 据 的 批量 朔 载 ， 性 能 监控 ， 目 动 调度 ETL 程序 ， 程 序 出 错 处 
理 ， 按 行 、 按 列 的 聚合 汇总 等 功能 。 

MÆ ETL 工具 的 发 展 ，ETL 的 管理 和 调度 功能 得 到 了 加 强 。 管 理 功 能 包括 ETL 程序 的 
备份 与 恢复 ， 版 本 升级 和 管理 。 调 度 功 能 包括 命令 触发 方式 、 事 件 触 发 方式 和 时 间 触 发 方式 。 
目前 很 多 公司 都 在 拓展 ETL 的 集成 性 ; ERAI ERA TAR API 增加 了 JavaScript 
语言 脚本 和 存储 过 程 的 调用 功能 ， 增 强 了 ETL 工具 的 灵活 性 。 



































4.7 ETL 的 作用 





商业 智能 数据 仓库 系统 由 数据 仓库 、 数 据 集 市 、 多 维 数据 分 析 组 成 。ETL 的 作用 瓯 是 解 
决 数据 集成 化 的 问题 。ETL 过 程 中 包 合 一 些 灵活 的 计算 、 汇 总 、 字 段 折 分 、 字 段 合 并 、 数 据 
比较 、 过 滤 、 混 合 运 复 等 内 容 ; 还 包括 对 目 定 义 疼 数 的 文 持 ， 复 杂 条 件 的 过 滤 ， 数 据 的 批量 
加 载 ， 时 间 类 型 的 转换 ， 多 种 数据 类 型 广 持 ， 去 重复 记录 等 功能 ， 如 图 4-6 所 示 。 商 业 管 能 
系统 的 目的 束 古 通过 数据 分 析 为 企业 管理 者 和 决策 者 提供 辅助 决 全 支持 。 因 为 数据 来 源 不 统 
一 ， 格 式 混乱 、 各 种 类 型 的 “ 脏 ” 数 据 都 增加 了 对 数据 集成 整合 的 难度 ， 所 以 需要 ETL 提供 
一 个 完整 的 方案 来 解决 数据 一 任性 和 集成 性 的 问题 。ETL 的 设计 和 实施 是 商业 智能 项 目 中 工 
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作 量 最 大 的 部 分 ， 也 是 最 重要 的 工作 内 容 ， 所 以 ETL Ze MI BER ECC SR. 


p 字段 的 拆 分 和 混合 运算 EE 
E 去 重复 记录 和 记录 间 合 并 或 计算 MEM 
pm 数据 的 批量 装载 ， 自 定义 函数 = 
me J—— 
x ARREU o 
EX 数据 预 响 和 性 能 监控 EL 
图 4-6 ETL 工具 可 以 实现 的 转换 要 求 














4.8 VERRETLIJTE 


我 们 已 经 知道 ETL 是 将 业务 系统 的 数据 经 过 抽取 、 清 洗 、 转 换 之 后 加 载 到 数据 仓库 的 过 
程 ， 通 常情 况 下 ， 整 个 商业 智能 项 目的 ETL 部 分 会 占 整 个 项 目的 1/3 以 上 ， 所 以 ETL 的 设计 
会 直接 决定 商业 智能 项 目的 成 败 。 下 面 详细 介绍 ETL 中 的 抽取 、 清 洗 、 转 换 、 加 载 等 各 个 部 
分 的 内 容 。 


4.8.1 数据 抽取 


数据 抽取 就 是 从 源 系 统 中 获取 业务 数据 的 过 程 。 数 据 的 抽取 需要 充分 满足 商业 智能 系统 
的 决策 分 析 需 要 ， 为 了 你 证 不 影响 系统 的 性 能 ， 数 据 抽取 时 需要 考 尾 很 多 因素 ， 包 括 : 抽取 
方式 、 抽 取 时 间 和 抽取 周期 等 内 容 。 例 如 ， 抽 取 方 式 包括 增 量 抽取 、 全 量 抽 取 。 抽 取 时 间 应 
该 尽量 在 系统 使 用 的 低 峰 时 段 ， 例 如 夜间 。 抽 取 的 周期 是 根据 业务 的 需求 制定 的 ， 例 如 按 小 
时 抽取 ， 或 者 按 天 、 月 、 季 度 、 年 等 。 在 数据 抽取 之 前 ， 需 要 确定 业务 系统 的 数据 情况 ， 了 
解数 据 量 的 大 小 ， 以 及 业务 系统 中 每 张 表 的 数据 结构 ， 字 段 台 义 ， 衣 之 间 的 关系 等 信息 ， 当 
搜集 完 这 些 信息 后 ， 才 能 进行 数据 抽取 的 设计 开发 等 工作 。 数 据 抽 取 有 下 和 面 儿 种 情况 : 

1) 如 朱 业 务 操作 型 数据 库 和 数据 仓库 之 间 的 数据 库 管 理 系 统 完全 相同 ， 上 只 需要 建立 相应 
的 连接 关系 束 可 以 使 用 ETL 工具 直接 访问 ， 或 者 调用 相应 的 SQL 语句 或 者 存储 过 程 。 

2) 如 果 数 据 仓 库 系 统 和 业务 操作 型 数据 库 的 数据 库 管理 系统 不 相同 ， 比 较 简 单 的 方式 古 
使 用 ETL 工具 导出 成 文本 文件 或 者 Excel 文件 ， 然 后 再 进行 统一 的 数据 抽取 。 

3) 如 果 雷 要 抽取 的 数据 量 非常 庞大 ， 此 时 必须 考虑 增 量 抽取 。 通 常用 标记 位 或 者 时 间 惟 
的 形式 ， 每 次 抽取 前 首先 判断 是 否 是 抽取 标记 位 或 者 是 当前 最 近 的 时 间 ， 然 后 再 将 数据 源 的 
数据 抽取 出 来 。 


4.8.2 ”数据 清洗 
一 般 情况 下 ， 数 据 清洗 的 目的 就 是 选择 出 有 缺陷 的 数据 ， 然 后 再 将 它们 正确 化 和 规范 化 ， 
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从 而 达到 用 户 要 求 的 数据 质量 标准 。 其 中 数据 缺陷 可 能 包括 以 下 几 种 情况 : 数值 重复 、 数 据 缺 
失 、 数 据 错 误 、 数 据 范 围 混 消 、 存 在 “及 ”数据 和 数据 不 一 至 
性 等 几 种 情况 , 如 图 4-7 所 示 。 其 中 数值 重复 是 指标 准 不 唯一 ， 
很 多 数值 都 代表 者 相同 的 含义 。 数 据 范围 混 消 是 指 相同 的 数值 
会 应 用 到 不 同 的 场合 中 ， 代 表 看 不同 的 含义 。 

第 一 步 ， 需 要 跟 业 务 部 门 进行 沟通 交流 ， 为 了 迫 高 数据 
的 质量 ， 得 到 标准 的 数据 ， 应 该 首先 过 滤 挥 不 符合 业务 要 求 
的 数据 ， 这 些 数 据 虱 违背 业务 规划， 数据 消 洗 过 程 会 根据 业 
务 规则 去 修正 这 些 数 据 ， 每 个 业务 规则 都 规定 了 数据 必须 满 
足 的 条 件 ， 然 后 通过 ETL 程序 去 修正 这 些 不 符合 业务 规则 的 
数据 。 

第 二 步 ， 为 了 确 你 用 于 决策 分 析 的 数据 质量 ， 需 要 跟 用 图 4 -7 USATE] 
尸 积 极 沟 通 ， 将 缺失 的 数据 补 全 ， 最 后 才能 过 小 到 数据 仓库 中 。 而 那些 错误 的 数据 ， 应 该 等 
用 户 完 全 修正 后 再 抽取 。 和 重复 的 数据 ， 同 样 应 该 等 用 户 确 认 人 完毕 后 再 进行 抽取 。 我 们 应 该 理 
解数 据 清洗 是 一 个 非 第 刁 时 、 复 末 的 工程 ， 需 要 多 个 业务 部 门 的 配合 和 拉 术 开发 人 员 对 业务 
数据 的 理解 ， 通 过 不 断 修正 问题 和 解决 问题 才能 完成 。 

数据 清洗 的 流程 包括 以 下 儿 个 方面 : 

(1) 定义 业务 数据 源 

标识 出 满足 需求 的 数据 产 ， 并 且 决 定 什 么 时 候 进 行 数据 清洗 。 

(2) 分 析 业 务 数 据 源 
































数据 范 
EEA 























(3) 将 数据 标准 化 

定义 标准 化 格式 的 数据 ， 并 且 加 以 转换 。 

(A) 通过 业务 规则 修正 错误 数据 

定义 是 否 为 正确 数据 的 标准 ， 确 定 如 何 处 理 错误 数据 的 方法 。 

(5) 合并 数据 

将 属于 同一 实体 的 多 个 数据 进行 合并 ， 合 并 时 应 该 有 去 重 的 功能 。 

(6) 总 结 数 据 钳 误 关 型 

通过 总 结 数 据 出 针 的 类 型 ， 提 高 清洗 程序 的 完整 性 和 正确 性 ， 从 而 降低 数据 出 现 重 大 问 
题 的 可 能 性 。 

数据 清洗 的 流程 图 如 图 4-8 所 示 。 


定义 业务 分 析 业务 uL 
Wim D| mm (D | 将 数据 标准 化 
iL 
uum m 通过 业务 规则 
合并 数据 。 | <D | 修正 错误 数据 


图 4-8 数据 清洗 的 流程 图 
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4.8.8 数据 转换 


数据 转换 是 指 从 业务 系统 中 抽取 出 源 数据 ， 然 后 再 根据 数据 仓库 模型 的 需求 ， 进 行 一 系 
列 数据 转换 的 过 程 。 

我 们 已 经 知道 数据 转换 是 整个 ETL 过 程 中 复杂 程度 最 高 的 过 程 , 包括 对 数据 不 一 致 性 的 转 
换 ， 业 务 指标 的 计算 和 有 某 些 数据 的 汇总 ， 为 决策 分 析 系 统 提供 数据 文 持 。 其 中 对 数据 不 一 致 性 
的 转换 束 是 依赖 于 编 公 表 的 议 计 ， 通 过 电压 等 级 编 但 表 〈 见 表 4-1) 将 不 同业 务 系统 中 相同 类 
型 的 数据 进行 转换 ， 即 将 各 个 省 市 的 电力 营销 系统 的 电压 等 级 编码 标准 化 ， 例 如 将 110kV 的 编 
码 统一 设置 成 1220kV 的 编码 设置 成 2380kV 的 编码 设置 成 3500kV 的 编码 设置 成 41000kV 的 编 
但 设置 成 $， 以 消除 数据 仓库 系统 中 数据 存在 不 一 致 的 可 能 。 




















表 4-1 电压 等 级 编码 表 


电压 等 级 /kV 电压 等 级 编码 
110 
220 
380 
500 


Qn | AI INI| = 


1000 





通过 建立 程序 代码 编写 规范 ， 与 模型 设计 小 组 共同 制定 编码 规则 ， 不 仅 可 以 提高 数据 模 
型 的 可 靠 性 、 可 读 性 、 可 修改 性 、 可 维护 性 和 一 致 性 ， 而 且 也 会 提高 数据 模型 的 可 继承 性 ， 
促使 每 个 人 的 成 果 可 以 互相 共享 。 同 时 也 应 该 建立 公共 的 编码 表 作 为 数据 转换 的 依据 ， 可 以 
根据 编码 表 制 定 的 业务 规则 进行 数据 的 转换 ， 保 证 数据 仓库 系统 内 部 数据 的 一 致 性 。 例 如 ， 
性 别 在 客户 关系 表 中 用 1 和 0 分别 代表 男 和 女 ， 而 在 单位 员工 表 中 可 能 使 用 m 和 f 区 分 男 和 
女 ， 所 以 需要 对 不 同业 务 表 中 相同 类 型 的 业务 含义 进行 统一 和 规范 。 

在 转换 过 程 中 ， 对 粒度 的 分 析 也 是 工作 的 重要 组 成 部 分 ， 因 为 存放 到 数据 仓库 中 的 数据 
对 粒度 的 要 求 可 能 不 相同 ， 用 户 需 要 将 低 粒度 的 数据 汇总 形成 决策 分 析 型 的 数据 ， 同 时 完成 
各 种 数据 指标 的 计算 ， 这 都 需要 经 过 ETL 转换 过 程 。 最 后 一 步 ， 将 转换 后 得 到 的 数据 加 载 到 
数据 仓库 中 ， 以 供 企业 高 层 领导 决策 分 析 时 使 用 。 

ETL 转换 过 程 可 能 包括 以 下 几 个 方面 : 

1) 对 空 值 的 处 理 : 如 果 在 转换 过 程 中 捕获 到 某 些 字段 存在 空 值 ， 在 进行 加 载 时 需要 将 罕 
值 奉 换 成 某 一 数据 或 者 直接 进行 加 载 ， 不 做 任何 转换 。 

2) 对 数据 格式 的 规范 化 : 根据 业务 数据 源 中 各 个 字段 的 数据 类 型 ， 进 行 数据 格式 的 规范 
和 统一 。 例 如 ， 统 一 将 数值 类 型 转化 成 字符 串 类 型 。 

3) 根据 业务 需求 进行 字段 的 拆 分 或 者 合并 。 

4) 对 缺失 数据 的 替换 : 根据 业务 需求 对 缺失 数据 进行 替换 。 

5) 根据 业务 规则 对 数据 进行 过 滤 。 

6) 根据 编码 表 进行 数据 唯一 性 的 转换 : 根据 编码 表 制 定 的 业务 规范 进行 数据 的 转换 ， 实 
现 数据 仓库 系统 内 部 数据 的 一 致 性 。 
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ETL 的 转换 过 程 如 图 4-9 所 示 。 


对 空 值 的 处 理 | OX 





a 对 缺失 数据 的 
替换 


图 4-9 ETL 的 转换 过 程 





4.8.4 数据 加 载 


数据 的 加 载 过 程 驶 是 将 已 经 转换 完成 的 数据 ， 存 放 到 目标 数据 库 的 过 程 。 这 是 ETL 过 程 
中 的 最 后 一 步 ， 需 要 保证 加 载 工具 必须 具有 高 效 的 性 能 去 完成 数据 加 载 ， 同 时 还 需要 考虑 数 
据 加 载 的 周期 和 数据 加 载 的 策略 。 数 据 加 载 策略 包括 时 间 玲 的 加 载 方式 、 全 表 对 比 的 加 载 方 
式 、 通 过 恋 取 日 志 表 进行 加 载 的 方式 、 全 表 删 除 后 再 进行 加 载 的 方式 ， 如 图 4-10 所 示 。 


























数据 加 载 策略 


时 间 惟 的 
行 加 载 的 
» 式 





图 4-10 数据 加 载 策略 


时 间 恰 的 加 载 方式 是 通过 对 源 系统 的 表 座 加 时 间 鹤 字段 , 将 系统 当前 时 间 和 时 间 鹤 的 值 进行 
对 比 ， 决 定 哪 些 业 务 数据 需要 锌 抽取， 可 以 实现 数据 的 递增 加 载 ， 是 比较 常见 的 一 种 加 载 方式 。 

全 表 对 比 的 加 载 方式 是 在 数据 加 载 前 , 将 每 条 数据 部 与 目标 表 的 所 有 记录 进行 全 表 对 比 ， 
根据 主键 值 是 否 相 同 ， 判 断 数据 是 更 新 还 是 插入 。 当 数据 量 比较 大 的 时 候 ， 有 耗 时 长 、 效 率 
低 的 缺点 。 通 名 也 对 全 表 对 比 进行 改进 ， 采 用 版 本 亏 、 标 记 了 字段 等 缓慢 变化 维 的 形式 进行 增 
量 的 抽取 。 

读 取 日 忘 表 的 加 载 方式 古 当 源 数 据 表 发 生 交 化 时 ， 不 断 更 新 日 记 表 的 信息 ， 日 志 表 的 信 
恩 作为 数据 加 载 的 一 个 依据 ， 但 是 日 志 表 维护 相对 麻烦 ， 会 存在 一 定 风 险 。 

全 表 删 除 后 再 插入 的 加 载 方 式 古 在 数据 加 载 前 ， 先 删除 目标 表 的 所 有 数据 ， 然 后 再 去 加 
载 全 部 的 数据 ， 但 是 不 能 实现 数据 的 递增 加 载 ， 效 率 较 低 ， 但 是 实现 方式 相对 简单 。 


4.8.5 ETL 的 日 志 


ETL 的 日 记功 能 非 第 曹 要， 可 以 记录 ETL 执行 过 程 中 的 每 一 步 信息 ， 包 括 运 行 的 起 始 时 
间 和 结束 时 间 ， 历 史 数 据 的 抽取 记录 ， 数 据 抽取 的 行 数 和 运行 到 佘 一步 的 出 错 信 息 ， 出 镜 时 
RISE AA. 当然 ETL 工具 是 目 动 产生 这 些 日 忘 信息 , 帮助 系统 维护 人 员 进 行 监控 的 , 如 果 ETL 
过 程 中 出 现 错误 ， 将 要 形成 错误 日 志 ， 系 统管 理 员 可 以 通过 邮件 或 者 其 他 方式 接收 到 该 错误 
言 轧 ， 然 后 对 该 错误 及 时 进行 处 理 。 当 然 我 们 已 经 知道 ETL 的 日 志 信 息 也 可 以 作为 数据 加 载 
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的 一 个 策略 ， 通 过 读 取 日 志 表 的 形式 有 计划 地 进行 数据 加 载 。 
4.9 ”ETL 优 化 








如 果 数 据 仓库 建设 中 的 ETL 都 是 由 SQL 和 调用 存储 过 程 、 函 数 来 实现 的 ， 那 么 SQL 语 
句 的 性 能 将 直接 影响 ETL 的 效率 。 可 以 将 ETL 优化 分 成 以 下 几 个 部 分 : 

1) 面 对 海 量 的 数据 ， 可 以 分 成 不 同 的 时 段 进 行 批量 数据 的 增加 、 删 除 、 修 改 、 碍 询 。 数 
据 的 抽取 、 清 洗 、 转 换 过 程 可 以 放 到 竣 晨 到 早上 8 点 左右 处 理 。 
2) 如 何 采 用 高 效 的 SQL 语句 是 ETL 优化 的 核心 和 和 曹 点。 游标 、 索 引 的 优化 在 第 2 章 中 
己 经 有 了 评 细 的 介绍 ， 在 此 不 再 次 述 。 














4.10 ETLi& iT 2328 8 ra 











ETL 设计 需要 遵循 业务 数据 处 理 的 要 求 ， 根 据 问题 的 多 样 性 和 不 确定 性 ， 在 设计 过 程 中 
需要 依照 以 下 原则 CUL] 4-11): 













确定 ETL 
HAERES fH 


ETL 的 
运行 管理 
和 监控 








ETL 的 
设计 原则 












确定 数据 S ESSE ES 
的 粒度 


况 的 处 理 





以 增 量 
抽取 方式 

作为 ETL 的 
设计 重点 








确定 ETL 


的 运行 周期 | 


图 4-11 ETL 的 设计 原则 





1) 在 ETL 设计 之 前 ， 需 要 根据 业务 的 需求 确定 所 要 分 析 的 主题 和 数据 结构 。 根 据 数 据 
CERRAH, AEE ETL 设计 中 古 侍 增加 预 留学 段 和 属性 。 

2) 确定 数据 的 粒度 。 可 以 通过 粗 粒 度 减 少数 据 的 总 量 ， 也 可 以 根据 细 粒 度 退 洲 到 最 乓 层 
的 数据 ， 探 如 原因 。 粒 度 的 大 小 是 业务 需求 和 分 析 的 主题 所 确定 的 。 


3) ETL 抽取 周期 的 确定 。 根 据 用 户 的 需求 ， 在 设计 ETL 之 醒 兢 应 该 确定 抽取 的 时 间 、 
抽取 的 周期 。 


4) 以 增 量 抽取 的 方式 作为 ETL 设计 的 重点 ， 减 少数 据 抽 取 的 压力 和 抽取 的 时 间 。 
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5) is CDS RAVE ELA VE AZ. MR A RJ] ATE AF AI E] BE BO RR 

6) 对 寞 第 情况 的 处 理 。 包 括 网 络 的 中 断 ， 数 据 流动 过 程 中 各 种 未 知 的 错误 ， 部 需要 通过 
相应 的 撞 施 去 解决 ， 以 保证 数据 的 正确 性 。 

7) 对 ETL 的 运行 管理 和 监控 措施 。 可 以 使 用 ETL 工具 中 的 管理 监控 组 件 对 ETL 进行 设 
Ho JE ETL 出 现 弄 利 时 可 以 进行 人 工 干预 ， 或 者 通过 程序 目 动 调度 功能 ， 对 每 一 步 的 钳 误 
异 第 都 调用 相应 的 处 理 程序 目 动 去 解决 ， 以 保证 数据 的 质量 。 

总 结 : 按照 以 上 设计 原则 ， 可 以 增加 数据 仓库 系统 的 灵活 性 和 扩展 性 ， 你 证 数据 的 正确 
性 ， 降 低 维护 成 本 。 





4.11 ”ETL 的 框架 结构 


ETL 的 框架 结构 包括 ETL HE MAR, AR, MRR WME 4-12 Brzn. 
它 的 每 一 步 包括 抽 取 、 转 换 、 加 载 鸭 信息 都 记录 到 日 志文 件 中 ， 以 便 系 统 维护 人 员 答 看 ETL 
的 运行 信息 ， 同 时 ETL 叉 有 异常 处 理 的 功能 ， 对 于 每 一 步 又 的 寞 第 部 有 相应 的 处 理 流程 。 

















ETL 服务 大 





图 4-12 ETL 框架 结构 图 


统一 调度 是 ETL 中 较为 重要 的 功能 。 通 常 有 以 下 两 种 调度 方式 。 

10 目 动 调度 方式 : 可 以 使 用 ETL 工具 ， 每 天 定时 启动 后 台 程 序 ， 自 动 完成 ETL 的 处 
理 流程 和 加 载 过 程 。 

2) 手工 方式 : 用 户 可 以 通过 前 台 应 用 系统 ， 使 用 它 的 监控 功能 对 一 些 ETL 处 理 程序 进 
行 手 工 调度 。 

当然 ， 无 论 采 用 何 种 调度 方式 ， 都 需要 有 报警 和 监控 的 功能 ， 用 来 提醒 管理 人 员 在 处 理 
数据 过 程 中 是 否 出 现 错误 。ETL 框架 结构 是 整个 商业 智能 系统 的 核心 部 分 ， 占 有 重要 地 位 。 




















4.12 ”本 草 小 结 





1) ETL 是 数据 仓库 项 目 中 最 艰难 且 耗 时 最 长 的 工作 ，ETL 系统 的 设计 和 开发 工作 对 商 
业 智 能 项 目的 成 败 产 后 至 关 重 要 的 影响 ，ETL 是 数据 抽取 (Extract)、 转 换 (Transform )、 
加 载 (Load) 的 人 简写。 
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2) ETL 本 质 上 就 是 数据 从 源 到 目标 的 过 程 〈 即 数据 流动 的 过 程 )， 所 以 一 般 ETL 工具 都 
提供 特定 语言 环境 〈JavaScript 语言 脚本 和 存储 过 程 的 调用 功能 ) 来 实现 高 级 转换 功能 。 

3) 元 数据 的 概念 在 数据 仓库 中 非常 重要 ， ETL 中 存在 大 量 的 数据 源 定义 和 映射 规则 、 
转换 规则 ， 这 些 都 是 元 数据 需要 管理 和 存储 的 。 

4) 影响 ETL 数据 质量 的 关键 因素 包括 以 下 儿 种 情况 。 

@ 可 能 会 有 一 部 分 数据 因为 客观 或 者 人 为 的 原因 导致 数据 格式 混乱 。 

e 源 系统 设计 存在 不 合理 性 。 

e 在 开发 过 程 中 ， 因 为 开发 人 员 的 错误 或 者 设计 人 员 对 业务 规则 描述 的 问题 ， 同 样 会 导致 

数据 质量 出 现 问题 。 

5) 质量 的 衡量 有 以 下 几 种 方式 : 定义 的 数据 是 否 和 实际 数值 相同 、 指 标 数据 是 否 符合 
业务 的 规则 、 数 据 是 否 和 业务 源 系 统 中 的 信息 保持 一 致 、 数 据 是 否 违背 自然 规律 或 者 不 符 
tris. 

6) 选择 合适 的 ETL 工具 是 实际 数据 仓库 项 目 中 必须 要 考虑 的 问题 ， 包 括 使 用 成 本 、 技 
术 人 员 对 此 工具 的 熟练 程度 、ETL 工具 开发 商业 智能 项 目的 成 功 案 例 和 工具 三 商 强 有 力 的 技 
术 文 持 ， 在 实际 项 目 中 ， 我 们 最 癌 用 的 工具 束 是 PowerCenter 和 Datastage， 一 些 公 司 甚至 也 
用 开源 的 ETL 工具 ， 例 如 Kettle. 

7) ETL 是 将 业务 系统 的 数据 经 过 抽取 、 清 洗 、 转 换 之 后 加 载 到 数据 仓库 的 过 程 ， 通 常情 
况 下 ， 整 个 商业 智能 项 目的 ETL 部 分 会 占 整个 项 目的 1/3 以 上 ， 所 以 ETL 的 设计 会 直接 决定 
商业 智能 项 目的 成 败 。 

8) 数据 清洗 的 流程 包括 以 下 几 个 方面 : 定义 业务 数据 源 、 分 析 业 务 数据 源 、 将 数据 标准 
化 、 通 过 业务 规则 修正 错误 数据 、 合 并 数据 、 总 结 数 据 错 误 类 型 、 转 换 和 加 载 。 

9) ETL 转换 过 程 可 能 包括 以 下 几 个 方面 : 对 空 值 的 处 理 、 对 数据 格式 的 规范 化 、 根 据 业 
务 需求 进行 字段 的 拆 分 或 者 合并 、 对 缺失 数据 的 蔡 换 、 根 据 业 务 规则 对 数据 进行 过 小 、 根 据 
编码 表 进 行 数 据 唯 一 性 的 转换 。 

10) 通常 ETL 的 数据 加 载 策略 包括 : 时 间 惟 的 加 载 方 式 、 全 表 对 比 的 加 载 方式 、 通 过 该 
取 日 志 表 进行 加 载 的 方式 、 全 表 删 除 后 再 进行 加 载 的 方式 。 

1D ETL 的 日 志 功能 非常 重要 ， 可 以 记录 ETL 执行 过 程 中 的 每 一 步 信 息 ， 包 括 运行 的 起 
始 时 间 和 结束 时 间 ， 历 史 数 据 的 抽取 记录 ， 数 据 抽取 的 行 数 和 运行 到 某 一 步 的 出 错 信 息 ， 出 
音 时 间 等 内 容 。 

12) 采用 高 效 的 SQL 语句 是 ETL 优化 的 核心 和 重点 。 

13) ETL 框架 结构 主要 包括 ETL 调度 、 抽 取 策 略 、 转 换 策 略 、 加 载 策略 等 。 

14) 统一 调度 是 ETL 中 较为 重要 的 功能 。 通 向 有 了 两 种 调度 方式 : 

e HEX: 可 以 使 用 ETL 工具 ， 每 天 定时 局 动 后台 程 序 ， 目 动 完 成 ETL 的 处 理 





































































































流程 和 加 载 过 程 。 
e 手工 方式 : 用 户 可 以 通过 前 台 应 用 系统 ,使 用 它 的 监控 功能 对 一 些 ETL 处 理 程 序 进行 
= 


DO 


第 5 章 商业 智能 联机 分 析 处 理 理论 简介 


本 章 目标 
本 章 将 重点 介绍 商业 智能 联机 分 析 处 理 (COnLine Analysis Processing, OLAP) 的 理论 知识 ， 
包括 OLAP 的 核心 概念 ，OLAP 友 挥 了 什么 样 的 作用 ，OLAP 与 OLTP WIXI, OLAP 的 实现 
方法 和 实施 过 程 等 内 容 。 
学 习 本 革 后 ， 您 将 掌握 : 
@ OLAP 的 定义 。 
OLAP 系统 和 OLTP 系统 的 区 别 。 
OLAP 系统 的 基本 目标 和 特点 。 
OLAP 系统 和 数据 仓库 系统 的 关系 。 
OLAP 系统 的 实施 过 程 。 
OLAP 模型 的 设计 与 实现 。 





5.1 OLAP 介 绍 


OLAP 系统 能 够 帮助 决策 分 析 人 员 从 多 个 角度 分 析 数 据 。 要 想 理 解 OLAP 的 概念， 必须 
先知 道 以 下 几 个 重要 的 概念 。 

D 维度 : 人 们 观察 事物 的 角度 ， 例 如 地 区 维度 、 时 间 维 度 、 产 品 维度 等 。 

2) 层 : 根据 维度 细 市 程度 的 不 同 ， 划 分 数据 在 逻辑 上 的 等 级 关系 ， 用 来 描述 维度 的 各 
个 方面 。 例 如 ， 时 间 维 度 包 括 年 、 季 度 、 月 、 日 等 层次 ， 地 区 维度 包括 国家 、 省 、 市 、 县 
等 层次 。 


维度 和 层次 的 关系 如 图 5-1 所 示 。 














维度 





图 5-1 维度 和 层次 的 关系 


3) 维度 的 成 员 : 维度 的 取 值 ， 即 维度 中 的 各 个 数据 元 素 的 取 值 。 例 如 ， 地 区 维度 中 有 具体 
的 成 员 有 英国 、 法 国 、 德 国 。 
维度 和 维度 成 员 的 关系 如 图 5-2 所 示 。 
4) 钻 取 : 通过 变换 维度 的 层次 ， 改 变 粒 度 的 大 小 。 它 包括 同上 馈 取 (Drill Up) £8 P 
钻 取 (Drill Down)。 加 上 馈 取 是 将 细节 数据 同上 妃 漳 到 最 高 层次 的 汇总 数据 。 问 下 铀 取 是 将 
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最 局 层次 的 汇总 数据 深入 到 最 低层 次 的 细 世 数据 中 。 


维度 


维度 的 成 员 





图 5-2 维度 和 维度 成 员 的 关系 


5) 旋转 : 通过 变换 维度 的 方向 ， 重 新 安排 维 的 位 置 ， 例 如 行列 互 换 。 

O 切片 和 切 块 : 在 一 个 或 者 多 个 维度 上 选取 固定 的 值 ， 分 析 其 他 维度 上 的 度量 数据 。 如 
果 其 他 维度 剩余 两 个 ， 则 是 切片 ， 如 果 是 3 个 ， 则 是 切 块 。 

7) 上 度量: 多 维 数据 的 取 值 。 例 如 ， 销 售 额 、 利 润 。 

8) ROLAP: 是 基于 关系 数据 库 的 OLAP， 以 关系 型 数据 库 为 基础 ， 对 多 维 数 据 的 存储 。 

9) MOLAP: 是 基于 多 维 数据 库 的 OLAP， 其 中 切片 、 切 块 是 主要 技术 。 

100 HOLAP: 是 基于 关系 型 和 多 维 窍 阵型 等 混合 型 的 OLAP 实现 。 

总 结 : OLAP 是 针对 决策 分 析 人 员 和 企业 管理 人 员 从 多 个 角度 对 数据 进行 分 析 ， 随 着 市 
场 竞 争 的 日 益 激 烈 ，OLAP 的 应 用 越 来 越 广泛 ， 它 可 以 从 不 同 的 角度 去 分 析 各 种 指标 ， 例 如 
当 分 析 企 业 利 润 指标 时 ， 可 能 综合 时 间 维 度 、 地 区 维度 、 产 品类 别 维度 、 客 户 类 别 维度 等 
种 因素 来 衡量 利润 的 值 是 多 少 ， 最 后 通过 报表 进行 展示 。OLAP 的 最 大 特点 束 是 通过 多 维 模 
型 ， 用 户 可 以 动态 地 从 多 个 角度 分 析 数 据 ， 增 加 了 分 析 的 灵活 性 和 时 效 性 ， 大 大 提高 了 企业 
管理 的 效率 ， 这 是 OLAP 发 展 的 根本 原因 。 


























5.2 OLAP 系 统 与 OLTP 系 统 的 区 别 


OLTP 在 线 联机 事务 处 理 ) 系统 主要 和 面 问 细 市 性 的 数据 ， 和 存储 的 部 是 当前 的 数据 ， 用 来 
文 持 日 党 业务 运作 。 这 些 数 据 都 是 可 以 更 靳 的 ， 数 据 处 理 量 相 对 较 小 。OLAP 系统 主要 是 综 
合 的 、 并 且 经 过 拓 炬 的 数据 ， 它 的 数据 主要 是 历史 数据 ， 不 可 修改 ， 数 据 处 理 量 相 对 较 大 ， 
主要 面 癌 决策 分 析 处 理 。 它 们 的 区 别 如 图 5-3 所 示 。 


OLTP 系统 OLAP 系统 




















。 细 方 性 数据 e 综合 和 经 过 提炼 的 
。 当 前 数据 数据 
。 可 更 新 的 e 历史 数据 


。 数 据 处 理 量 较 小 。 不 可 修改 

。 面 向 事务 处 理 e 数据 处 理 量 较 大 

。 面 向 业务 操作 人 员 。 面 问 决 策 分 析 处 理 
。 面向 决策 管理 层 人 员 





图 5-3 OLTP 系统 和 OLAP 系统 的 区 别 


SY 


5.3 ”OLAP 的 实现 方法 








OLAP 有 多 种 实现 方法 , 根据 存储 数据 方式 的 不 同 , 可 以 分 为 ROLAP、MOLAP、HOLAP， 
如 图 5-4 所 示 。 





图 5-4 根据 存储 方式 划分 的 OLAP 的 实现 方法 


ROLAP (Relational OLAP) 表示 基于 关系 型 数据 库 的 OLAP 实现 。 它 的 技术 依赖 于 
关系 型 数据 ， 以 关系 型 数据 库 为 核心 ， 以 关系 型 结构 对 多 维 数据 进行 数据 存储 和 展现 。 
通常 ROLAP 将 多 维 数 据 分 成 事实 表 和 维 表 ， 事 实 表 存 储 的 都 是 指标 数据 和 维 表 的 关键 
字段 值 ， 维 表 多 数 存 储 维度 的 层次 、 维 度 的 成 员 值 等 信息 。 事 实 表 以 存储 的 产品 ID、 产 
mW ID. Jh ID 和 时 间 ID 作为 连接 维 表 的 关键 字段 ， 以 销售 数量 作为 指标 数据 。 维 
表 有 产品 维 表 、 时 间 维 表 、 产 品类 型 维 表 、 地 理 位 置 维 表 。 维 表 和 事实 表 通 过 主 外 关键 
字 关 联 在 一 起 ， 形 成 了 星 型 模式 ， 如 图 5-5 所 示 。 对 于 层次 复杂 的 维 ， 可 以 使 用 多 个 表 
来 描述 , 这 种 对 星 型 模式 的 扩展 称 为 雪花 型 模式 。 事实 表 以 存储 的 产品 ID 、 产 品类 型 ID、 
地 址 ID 和 时 间 ID 作为 关联 维 表 的 关键 字段 ， 以 销售 数量 作为 指标 数据 。 维 表 有 产品 维 
表 、 时 间 维 表 、 产 品类 型 维 表 、 地 址 维 表 ， 地 址 维 表 又 包括 国家 、 省 级 、 地 市 等 维 表 ， 
如 图 5-6 所 示 。 通 过 最 大 限度 地 减少 数据 存储 量 以 及 关联 较 小 的 维 表 来 改善 数据 得 询 的 


性 能 ， 这 是 典型 的 雪花 型 模式 。 
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图 5-5 ROLAP 的 多 维 关系 图 ( 星 型 模式 ) 
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省 级 维 
省 级 键 
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地 市 维 
地 市 键 
地 市 名 称 





图 5-6 ROLAP 的 多 维 关 系 图 (雪花 型 模式 ) 
MOLAP (Multidimensional OLAP) 表示 基于 多 维 数据 的 OLAP 实现 。 它 的 技术 手段 主要 
有 “ 切 块 和 “切片 ” 数据 检索 速度 较 快 ， 但 是 生成 立方 体 的 时 间 较 长 ， 数 据 存 储 在 多 维 立 方 
体 中 。MOLAP 多 维 立 方 体 如 图 5-7 所 示 。 





























图 $-7 MOLAP 多 维 立 方 体 





HOLAP (Hybrid OLAP) 表示 基于 混合 型 的 OLAP 实现 。 它 的 技术 主要 结合 MOLAP 和 
ROLAP 两 种 技术 的 优点 。 





5.4 OLAP 的 基本 目标 和 特点 








OLAP 的 基本 目标 融 是 文 持 决 案 分 机 和 多 维 数据 得 询 。OLAP 通过 对 信息 的 各 种 形式 的 
存 取 ， 满 中 企业 决策 人 员 和 管理 人 员 对 复杂 会 询 的 人 处理， 并 且 将 结果 提供 给 决策 分 析 人 员 ， 
使 他 们 对 企业 的 运 宫 状况 有 更深 入 的 了 解 ， 能 够 制定 出 正确 的 决策 方针 。OLAP 是 引领 企业 
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发 展 的 灯塔 。 

OLAP 系统 的 特点 包含 以 下 几 个 方面 : 

D 丰富 的 报表 展示 功能 : OLAP 系统 一 般 有 丰富 的 报表 展示 功能 , 例如 柱 形 图 、 折 线 图 、 
饼 形 图 。 

2) 数据 访问 和 多 维 分 析 的 能 力 : 提供 给 用 户 数 据 访问 和 多 维 分 析 的 能 力 ， 并 以 用 户 希 望 
的 方式 进行 展示 。 

3) 快速 的 数据 分 析 能 力 : OLAP 系统 有 秒 级 的 数据 分 析 能 

OLAP 的 特点 如 图 5-8 所 示 。 










OLAP 系统 
的 特点 





数据 访问 
和 多 维 分 
析 的 能 


图 5-8 OLAP 的 特点 


5.5 建立 OLAP 的 过 程 


建立 OLAP 的 过 程 如 图 5-9 所 示 。 


定义 ROLAP 模型 


OLAP 系统 T iiil 
iiil 构造 MOLAP 模型 


Ll 








图 $-9 建立 OLAP 的 过 程 


5.6 OLAP 与 数据 仓库 的 天 系 


为 了 提高 OLAP 系统 的 效率 ， 设 计数 据 仓 库 时 应 该 考虑 如 下 因素 : 
1) 为 事实 表 和 维度 表 中 的 关键 字 创 建 索 引 ， 以 提高 数据 得 询 的 效率 。 同 一 闫 数据 尽 可 能 
使 用 一 个 事实 表 ， 以 减少 表 之 间 的 关联 。 
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2) 事实 表 中 尽量 不 要 包含 汇总 类 型 的 数据 。 

3) 维 表 的 设计 应 该 符合 第 三 范式 的 约束 ， 维 表 中 不 要 存储 无 基 的 数据 。 

4) 数据 仓库 设计 的 好 坏 直接 影响 建立 OLAP 系统 的 难 易 程度 和 效率 ， 同 时 OLAP 系统 
又 是 数据 仓库 系统 的 一 种 多 维 展现 方式 。 














5.7 OLAP 系 统 的 实施 过 程 


OLAP 系统 的 实施 过 程 〈 见 图 5-10) 包括 以 下 几 个 步 又: 

1) 源 系 统 经 过 ETL 过 程 装 载 到 ODS 数据 绥 冲 区 中 , 目的 是 将 所 有 的 业务 数据 集成 
起 来 。 

2) 从 ODS 数据 缓冲 区 中 将 数据 抽取 到 ODS 统一 信息 视图 区 ， 目 的 是 使 用 户 能 够 通过 
ODS 统一 信息 视图 区 获得 跟 某 个 主题 域 相关 的 实时 数据 。 

3) 将 数据 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 中 。 

4) 数据 集 市 里 的 数据 在 数据 仓库 中 经 过 转换 、 汇 总 计算 获取 ， 直 接 文 撑 OLAP 多 
维 分 析 。 

5) 最 后 OLAP 系统 文 持 多 维 数据 分 析 。 
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图 5-10 OLAP 系统 的 实施 过 程 





5.8 ”OLAP 模 型 的 设计 与 实现 





(OD 了 解 用 户 的 需求 

作为 解决 方案 的 提供 者 ， 我 们 需要 理解 业务 规则 ， 了 解 当前 的 业务 状况 ， 不 仅 需 要 和 系 
统 相 关 人 员 进 行 交 流 ， 还 需要 和 系统 的 设计 者 和 开 友 者 进行 沟通 。 首 先 ， 对 用 户 进 行 分 奖 ， 
理解 用 户 对 数据 的 可 用 性 和 访问 速度 的 要 求 。 第 二 ， 需 要 了 解 不 同 用 户 对 系统 的 访问 频率 ， 
每 关 用 户 的 数量 和 需要 分 析 的 数据 量 是 多 少 。 第 三 ， 需 要 大 致 清楚 系统 的 数据 总 量 应 该 是 多 
少 。 当 我 们 已 经 了 解 了 用 户 和 数据 源 的 基本 情况 后 ， 可 以 考虑 系统 能 够 满足 客户 的 需求 是 哪 
些 。 用 户 、 开 友 者 、 官 理 者 足 通 过 征求 文档 进行 区 流 沟通 的 ， 如 图 5-11 所 示 。 而 用 户 最 关心 
的 问题 就 是 开发 者 是 侣 完成 了 需求 文档 所 要 求 的 功能 特性 。 

(2) 网 辑 模型 的 设计 

通常 所 说 的 数据 模型 一 般 有 两 个 层次 : 好 辑 层 、 物 理 层 。 远 辑 模 型 摘 述 现实 世界 的 内 
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在 规律 和 业务 规则 。 物 理 模 型 描述 数据 库 内 部 存储 的 具体 实现 。OLAP 模型 是 一 个 远 辑 概 
念 ， 主 要 是 对 效 据 进 行 多 角度 的 分 析 ， 以 便 为 企业 决策 者 和 管理 者 提供 各 种 信息 和 知识 。 
“多 维 结构 ”是 OLAP 世界 的 核心 ， 而 多 维 模 型 通过 维度 、 层 次 、 度 量 三 者 之 间 的 关系 分 
析 数 据 。 举 例 来 说， 如 朱 有 一 个 销售 系统 ， 度 量 值 可 能 包括 销售 额 、 成 本 、 利 润 ， 维 度 包 
括 时 间 、 产 品类 型 。OLAP 他 辑 模 型 的 设计 束 像 是 桥梁 ,一 并 是 用 户 的 需求 ， 为 一 蜗 是 业 
务 数据 源 。 销 售 额 、 成 本 、 利 润 是 需要 展现 、 存 储 的 内 容 ， 随 着 时 间 、 产 品类 型 的 变化 而 
变化 。 


























Di /pm e 
WA 


管理 才 
图 5-11 了 解 用 户 的 需求 


(3) OLAP 的 分 析 过 程 

首先 根据 馆 辑 模型 定义 OLAP 多 维 模型 ， 在 定义 模型 的 过 程 中 ， 需 要 根据 业务 需求 定义 
立方体” 分 析 方 法 有 “切片 ”和 “ 切 块 ”” 例如 ， 在 “和 利润、 地区、 时间 ”三 维 立 方 体 中 进 
行 切 块 和 切片 ， 可 得 到 各 地 区 、 各 产品 的 销售 利润 情况 ， 如 图 5-12 所 示 。 

















o 利润 
E f EE 
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图 5-12 商业 智能 OLAP 的 例子 


5.9 本草 小 结 


1? OLAP 是 联机 分 析 处 理 ， 丙 文 名 称 OnLine Analysis Processing。OLAP 系统 能 够 帮助 
决策 分 机 人 员 从 多 个 角度 分 析 数 据 。 

2) OLTP 在 线 联机 事务 处 理 ) 系统 主要 面 问 细节 性 的 数据 ， 存 储 的 都 是 当前 的 数据 ， 
用 来 文 持 日 冲 业 务 运 作 。 这 些 数据 都 是 可 以 更 新 的 ， 数 据 处 理 量 相 对 较 小 。OLAP “〈 联 机 分 
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析 处 理 ) 系统 主要 是 综合 的 、 并 且 经 过 提炼 的 数据 ， 它 的 数据 主要 是 历史 数据 ， 不 可 修改 ， 
数据 处 理 量 相 对 较 大 ， 主 要 面 问 决策 分 析 处 理 。 

3) OLAP 有 多 种 实现 方法 ， 根 据 存储 数据 的 方式 不 同 ， 可 以 分 为 ROLAP、MOLAP、 
HOLAP. 

4) OLAP 系统 的 特点 包含 以 下 几 个 方面 : 丰富 的 报表 展示 功能 、 数 据 访 问 和 多 维 分析 的 
能 力 、 快 速 的 数据 分 析 能 

5) OLAP 模型 的 设计 与 实现 包括 了 解 用 户 的 需求 、 逻 辑 模型 的 设计 、OLAP 的 分 析 
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第 6 章 ”ODS 与 数据 仓库 的 结合 


本 章 目标 

当 用 户 要 了 解 企 业 当 前 的 运营 状况 ,企业 未 来 儿 年 的 发 展 战略 ,企业 当前 的 销售 情况 时 ， 
可 通过 ODS 系统 与 数据 仓库 的 结合 来 解决 。 通 过 本 章 的 学 习 ， 可 以 了 解 ODS 的 基本 概念 ， 
ODS 的 发 展 情 况 ，ODS 系统 与 数据 库 系 统 、 数 据 仓库 系统 的 区 别 ，ODS 的 主要 功能 ，ODS 
的 特点 ，ODS 的 设计 方法 等 内 容 。 

学 习 本 章 后 ， 您 将 掌握 : 

e ODS 的 概念 。 

@ ODS 的 特点 。 

e ODS 与 数据 库 的 区 别 。 

e ODS 与 数据 仓库 的 区 别 。 

e ODS 的 主要 功能 。 

















6.1 ODS 的 概念 





ODS 是 操作 数据 存储 的 缩写 ， 瑞 文 全 称 为 Operational Data Store。 通 过 亲 几 章 的 学 习 ， 我 
们 已 经 知道 数据 仓库 是 一 个 面 问 主 题 、 集 成 、 相 对 稳定 的 、 反 映 历 史 变 化 的 数据 集合 ， 用 于 
文 持 用 户 的 辅助 决策 分 析 。 而 ODS 则 是 一 个 面 同 主题 的 、 集 成 的 、 可 变 的 、 反 映 当 前 细节 的 
数据 集合 。 它 主要 用 于 文 持 企业 处 理 业 务 应 用 和 存储 面 癌 主题 的 、 即 时 性 的 集成 数据 ， 为 企 
业 决 策 者 提供 当前 细 和 性 的 数据 ， 通 第 作为 数据 仓库 的 过 渡 阶 段 。 

















6.2 ODS 的 特点 


业务 数据 经 过 ETL 数据 抽取 、 转 换 、 加 载 进 入 到 ODS 系统 中 ， 为 企业 提供 了 一 种 全 局 
的 、 集 成 的 和 反映 当前 实时 性 的 视角 ， 在 文 持 企业 决 东 分 析 需 求 的 同时 ， 还 能 够 在 业务 系统 
和 数据 仓库 之 间 构 建 一 个 数据 缓冲 市 ， 使 得 数据 之 间 的 传输 和 转换 相对 容易 。ODS 系统 的 主 
要 功能 束 是 将 多 个 业务 系统 中 不 同 的 数据 源 进 行 数据 集成 ， 通 过 数据 抽取 、 和 转换、 加载 将 数 
据 放 入 到 共 圣 的 存储 区 中 ， 以 保证 数据 的 一 任性 。ODS HUS UA PES 

1) 数据 是 不 断 更 新 和 易 丢 失 的 ， 当 新 的 业务 数据 进入 到 ODS 时 ， 旧 的 数据 会 被 狐 数据 
窗 广 或 者 更 新 ， 一 般 不 存储 历史 数据 ， 只 反映 当前 实时 性 的 信息 。 

2) ODS 系统 一 般 存储 的 都 是 细节 性 的 信息 ， 很 少 有 汇总 的 数据 ， 即 ODS 包含 粒度 级 列 
































最 低 的 数据 。 
3) ODS 系统 文 持 快 速 的 数据 更 狐 操 作 ， 数 据 刷 新 频率 很 快 ， 一 般 不 你 和 存 过 期 的 历史 
数据 。 





4) ODS 系统 一 般 存 储 在 关系 数据 库 中 ， 通 过 将 各 个 业务 系统 的 数据 集成 起 来 ， 组 成 企 
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业 的 全 局 统一 性 视图 ， 实 现 ODS 的 数据 共享 功能 。 
5) 用 户 可 以 频 索 访问 ODS 系统 ， 因 为 它 是 基于 操作 型 应 用 的 。 
ODS 的 数据 具有 面 问 主题 的 、 集 成 的 、 可 变 的 、 数 据 是 当前 的 或 是 接近 当前 的 等 基本 

















6.3 ”ODS 系统 与 数据 库 系 统 、 数 据 仓库 系统 的 区 别 


ODS 系统 是 既 不 同 于 一 般 的 数据 库 系 统 ， 又 不 同 于 数据 仓库 系统 的 一 种 特殊 的 数据 存 
储 系 统 。 它 与 一 般 数据 库 有 很 多 区 别 ， 它 的 数据 组 织 方 式 是 面 癌 主题 的 、 集 成 的 ;而 数据 
库 系统 则 是 面向 应 用 和 事务 处 理 的 。ODS 系统 与 数据 仓库 系统 相 比 ， 它 只 存储 当前 的 、 细 
节 性 的 信息 或 者 接近 当前 的 实时 性 数据 ， 可 以 对 数据 进行 增加 、 删 除 和 修改 等 操作 ， 而 数 
据 仓库 系统 是 面 问 主题 和 集成 的 ， 但 是 数据 一 般 不 进行 修改 ， 并 且 存 储 大 量 的 历史 数据 。 
ODS 系统 和 数据 仓库 系统 的 主要 区 别 体 现在 数据 的 时 间 性 、 稳 定性 、 可 修改 性 、 细 方 性 和 
用 户 访问 频率 上 。 

ODS 系统 与 数 库 系统 、 数 据 仓库 系统 的 区 别 如 图 6-1 rz. 

(12 ODS 系统 与 数据 仓库 的 区 别 

D ODS 系统 是 业务 数据 进入 到 数据 仓库 系统 中 的 一 段 临 时 存储 区 域 ， 存 储 当 前 或 者 接 
近 当 前 的 实时 性 数据 ;而 数据 仓库 一 般 只 存储 历史 数据 。 

2) ODS 系统 对 数据 的 更 新 是 频 索 的 ;而 数据 仓库 中 的 数据 是 不 能 更 新 的 ， 数 据 的 任何 
变化 都 应 该 反映 到 数据 仓库 中 。 

3) ODS 系统 主要 存储 细节 性 的 数据 ;而 数据 仓库 系统 既 包含 细 区 性 的 历史 数据 ， 同 时 
也 包含 轻 度 汇总 的 数据 。 

(2) ODS 系统 与 数据 库 的 区 别 

D 数据 库 系统 主要 是 面 问 事物 处 理 和 应 用 的 ; 而 ODS 系统 主要 是 面 癌 主题 的 ， 集 成 的 。 

2) 数据 库 系统 的 用 户 量 相 对 较 大 ， 而 ODS 系统 面 对 的 用 户 数量 相对 较 小 。 


数据 库 系统 数据 仓库 系统 


。 面 器 应 用 、 事 务 处 理 。 面向 主题 、 集 成 的 。 面向 主题 、 集 成 的 
。 实 时 性 高 e 实时 性 要 求 高 。 实 时 性 要 求 不 高 

。 数 据 检索 量 小 。 数 据 检索 量 小 。 数 据 检 索 量 大 

。 只 存储 当前 数据 。 一 般 只 保留 当前 数据 。 存 储 大 量 历史 数据 和 
。 访 问 频 率 高 。 访问 频率 高 轻 度 汇总 的 数据 

。 啊 应 时 间 控 制 到 1s “响应 时 间 控 制 到 1s 。 访问 频率 中 、 低 

以 下 AP e 响应 时 间 需 几 秒 或 者 
“用 户 数量 大 “用 户 数量 相对 较 小 



























































更 长 
。 用 户 数量 相对 较 小 


图 6-1 ODS 系统 与 数据 库 系统 、 数 据 仓库 系 统 的 区 别 


6.4 ODS 的 主要 功能 


ODS 的 主要 功能 如 网 6-2 所 示 。 
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作为 业务 系 
统 和 数据 仓 
库 之 间 的 隔 
Bo 















为 企业 提供 






统一 的 数据 视 降低 业务 
图 和 数据 共 了 个 系统 的 压力 






享 的 功能 










检查 数据 TE a 
质量 的 功能 
数据 的 要 求 
实时 性 的 数 
据 整 合 功能 





图 6-2 ODS 的 主要 功能 


D 作为 业务 系统 和 数据 仓库 之 则 的 隔离 地 市 

一 般 来 说 ， 数 据 仓库 系统 的 数据 来 源 非 第 复 林 ， 数 据 可 能 存储 在 不 同 的 应 用 系统 和 业务 
数据 库 中 ， 为 了 满足 数据 仓库 对 业务 数据 的 抽取 标准 ， 需 要 在 应 用 系统 和 数据 仓库 系统 之 间 
EAMA WE 6-3 R. ODS 系统 作为 隔离 墙 的 目的 是 临时 存储 多 个 业务 源 数 据 ， 
经 过 一 系列 的 清洗 、 转 换 达 到 数据 仓库 对 数据 的 要 求 后 ， 再 将 数据 加 载 到 数据 仓库 中 。 











THART 





图 6-3 ODS 的 隔离 墙 功能 


在 业务 系统 中 直接 将 数据 抽取 到 数据 仓库 中 并 不 容易 ，ODS 系统 作为 业务 系统 和 数据 仓 
库 系 统 之 间 的 隅 离 地 市 ， 用 于 存放 从 业务 系统 抽取 出 来 的 数据 ， 为 数据 仓库 提供 了 平整 、 可 
AE MIZER o 

(2) 降低 业务 系统 的 压力 

在 数据 仓库 建立 之 前 ， 大 量 的 决策 分 析 报 表 是 由 业务 系统 直接 生成 的 ， 在 报表 生成 过 程 
中 可 能 存在 复杂 的 计算 ， 对 业务 系统 的 运行 产生 非常 大 的 压力 。 在 建立 ODS 系统 之 后 ， 原 来 
由 业务 系统 二 接 产生 的 复杂 报表 、 对 细节 数据 的 得 询 都 能 够 在 ODS 系统 中 进行 ， 从 而 有 效 降 
低 了 业务 系统 的 得 询 压力 ， 提 局 了 业务 系统 的 运行 效率 。 
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(3) 满足 从 微观 角度 得 询 细 节 数 据 的 要 求 

一 般 来 说 ， 在 数据 仓库 体系 结构 中 ， 数 据 仓 库 层 存储 的 数据 都 是 经 过 轻 度 汇总 的 数据 和 
历史 数据 ， 几 乎 不 存储 任何 生产 运营 过 程 中 产生 的 细 克 数据 。 但 是 ， 为 了 满足 特殊 用 户 和 群体 
的 要 求 ， 可 能 需要 对 一 些 交 易 数 据 进 行 答 询 ， 这 时 需要 把 得 询 这 些 交 易 数据 的 功能 让 ODS 系 
统 来 实现 。 通 单 ，ODS 系统 文 持 多 维 分 析 的 功能 ， 因 为 它 也 古 面向 主题 的 ， 集 成 的 。 数 据 仓 
库 从 宏观 上 文 持 多 维 决策 分 析 ， 而 ODS 系统 从 微观 角度 描述 细节 性 的 数据 查询 。 

(4) 实时 性 的 数据 整合 功能 

ODS 系统 其 有 实时 性 的 数据 整合 功能 。 它 通过 ETL 技术 ， 实 时 地 从 各 个 业务 系统 中 抽 
取 企 业 的 运营 交易 数 据 ， 通 过 数据 转换 、 请 洗 、 加 载 等 操作 最 终 形 成 共计 数据 ， 为 企业 提 
供 统一 的 数据 视 网 。 这 种 数据 整合 功能 有 助 于 提高 数据 的 一 致 性 ， 为 数据 仓库 提供 优质 的 
数据 源 。 

(5) 检 醋 数据 质量 功能 

ODS 系统 具有 完善 的 数据 质量 检查 功能 。 它 通过 对 企业 数据 的 质量 检查 和 质量 评估 ， 完 
普 企 业内 部 的 组 织 机 构 ， 文 持 对 数据 质量 管理 流程 的 监控 ， 从 而 实现 对 源 数据 质量 问题 的 发 
现 和 修正 。 

(6) 为 企业 提供 统一 的 数据 视图 和 数据 共 圣 功能 

ODS 系统 为 企业 提供 统一 的 数据 视图 和 数据 共 圣 功能 。 它 通过 对 各 个 业务 系统 运 维 数据 
的 集成 ， 实 现 ODS 的 数据 共享 ， 同 时 为 企业 提供 全 局 的 统一 数据 视 赔 。 



































6.5 ODS 的 设计 步骤 


ODS 的 设计 步骤 〈 见 图 6-4) 如 下 : 

(1 ) 数据 调研 

数据 调研 主要 是 根据 业务 人 员 提 供 的 需求 意 回 ， 将 业务 系统 划分 成 儿 个 模块 ， 并 对 各 个 
模块 所 涉及 的 数据 和 数据 源 进行 调研 分 析 。 数 据 调 研 分析 可 以 分 成 编号、 模块 名 称 、 数 据 来 
JU (包括 导入 和 输入 )、 备 注 等 信息 ， 见 表 6-1。 


表 6-1 数据 调研 分 析 表 


数据 来 源 & dE 
编 5 模块 名 称 
1 生产 数据 


2 基本 数据 











(2) 确定 数据 苑 于 
确定 数据 范围 是 在 需求 调研 的 基础 上 进行 的 。 为 了 保证 所 需 的 数据 都 能 够 从 业务 系统 中 
得 到 ， 需 要 将 应 用 需求 与 ODS 的 数据 范围 结合 起 来 ， 也 就 是 对 ODS 进行 主题 的 划分 。 通 名 
来 说 ，ODS 主题 的 划分 是 以 企业 的 业务 模型 为 基础 ， 通 过 参考 各 种 业务 系统 信息 模型 ， 得 到 
ODS 数据 主题 的 范围 ， 根 据 该 范围 进行 ODS 主题 的 定义 ， 从 而 确定 ODS 的 数据 范围 。 
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(3) 设计 主题 元 素 

ODS 系统 的 主题 元 了 系 主要 包括 主题 名 称 、 维 度 、 度 量 值 、 粒 度 、 存 储 的 时 间 。 下 面 进行 
详细 的 介绍 。 

e 主题 名 称 : 说 明 该 主题 主要 包含 哪些 分 析 数 据 ， 用 户 重 点 关注 的 对 象 是 什么 。 

e 维度 : 说 明 数 据 分 析 时 的 角度 有 哪些 ， 例 如 时 间 维 度 的 年 、 季 、 月 、 日 等 。 

e gH: 说 明 用 户 关注 的 指标 值 ， 例 如 工资 额 、 销 售 量 等 。 

e JV: 是 指 对 数据 的 细 化 程度 。 一 般 来 说 ， 细 化 程度 越 蜗 ， 粒 上 度 级 列 残 越 小 ， 细 化 程 























ERIR, MERIK. 
e 存储 的 时 间 : 主要 描述 数据 的 存储 周期 和 存储 期 限 是 多 少 。 
(4) ODS 系统 的 物理 实现 
ODS 系统 的 物理 实现 主要 包括 : 数据 库 的 物理 实现 ， 数 据 抽取 的 设计 等 内 容 ， 如 图 6-4 所 示 。 


y 
y 


ODS 系统 的 物理 实现 


图 6-4 ODS 系统 的 设计 步骤 





6.6 ”基于 ODS 和 基于 数据 仓库 的 OLAP 之 则 的 天 系 





建立 基于 ODS 系统 的 即时 OLAP 应 用 是 建立 决策 分 析 的 一 种 解决 方案 , 通常 应 用 于 中 低 
级 别 的 决策 分 析 应 用 。 建 立 基 于 数据 仓库 的 OLAP 应 用 是 为 了 进行 长 期 的 趋势 分 析 ， 但 是 一 
般 运 行 较 慢 。 如 果 企 业 决 策 者 需要 碍 看 周期 时 间 较 短 的 一 些 指标 情况 ， 不 需要 太 多 的 历史 数 
据 ， 这 样 就 需要 建立 基于 ODS 的 即时 OLAP 应 用 。 例 如 ， 查 看 一 周 之 内 的 各 地 区 销售 情况 ， 
只 需要 参考 当前 时 间 内 一 周 的 历史 数据 ， 如 果 在 数据 仓库 中 建立 即时 OLAP 应 用 ， 运 行 效率 
非常 低 ， 并 且 很 难 准确 地 反映 当前 时 间 的 各 地 区 销售 情况 。 基 于 ODS 和 基于 数据 仓库 的 
OLAP 之 则 的 关系 如 图 6-5 所 示 。 


基于 ODS 的 即时 基于 数据 仓库 的 
OLAP 应 用 即时 OLAP 应 用 


。 在 决 策 分 析 系 。 JE DR AY MT AR 
统 的 一 种 解决 统 的 一 种 解决 




















方案 方案 

。 iik H TES 。 满足 长 期 趋势 
的 趋势 分 析 的 分 析 

。 运行 时 间 较 短 。 运行 时 间 较 长 





图 6-5 基于 ODS 和 基于 数据 仓库 的 OLAP 之 间 的 关系 
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6.7 ”数据 库 系 统一 ODS 系统 的 转化 机 制 


数据 库 系 统 是 操作 型 环境 ， 数 据 分 散 ， 而 ODS 系统 是 面向 主题 的 操作 型 环境 。 通 过 定义 
ODS 系统 的 表 结 构 ， 数 据 库 系统 回 ODS 系统 提供 数据 ， 当 ODS 系统 的 数据 发 生变 化 时 ， 必 
须 反 映 到 数据 库 系 统 中 。 它 们 的 转化 机 制 如 图 6-6 所 示 。 


数据 库 系 统 ODS 系统 
ad 传递 数据 
a 更 新 数据 


图 6-6 数据 库 系统 一 ODS 系统 的 转化 机 制 


6.8 ODS 系统 的 逻辑 模型 


ODS 系统 的 好 辑 模型 主要 包括 星 型 模型 、 雪 花 型 模型 、 泥 合 型 模型 3 种 ,如 图 6-7 所 示 。 
星 型 模型 通常 由 事实 表 和 多 个 维 表 组 成 。 雪 花 型 模型 是 对 星 型 模型 的 扩展 ， 它 将 维 表 进一步 
层次 化 ， 在 其 他 章节 中 有 详细 的 介绍 。 混 合 型 模型 是 将 星 型 模型 和 雪花 型 模型 结合 起 来 ， 增 
加 了 应 用 程序 的 灵活 性 。 















































图 6-7 ODS 系统 的 逻辑 模型 


6.9 ”ODS 系统 的 染 构 


ODS 系统 的 架构 如 图 6-8 所 示 。 
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图 6-8 ODS 系统 的 架构 


6.10 ODS 系统 的 功能 





一 般 来 说 ， 在 数据 仓库 系统 中 ， 存 储 的 数据 都 是 轻 度 汇总 的 指标 数据 或 者 历史 数据 ， 很 
少 有 细 克 性 的 、 当 前 的 生产 运营 数据 ， 但 是 在 特殊 的 应 用 中 ， 用 户 可 能 会 对 这 些 生产 数据 进 
行 答 询 ， 数 据 仓库 不 文 持 这 些 特殊 的 得 询 ， 这 部 分 功能 可 以 由 ODS 系统 来 实现 。 

ODS 系统 个 仅 可 以 文 持 多 维 分 析 等 胆 询 功 能 ， 还 可 以 满足 对 细节 性 的 区 易 数据 或 者 粒度 
级 别 很 低 的 数据 进行 得 询 。 因 为 ODS 系统 是 投 照 血 问 主 题 的 方式 进行 数据 存储 ， 同 时 它 又 只 
存储 当前 时 间 段 内 的 或 者 接近 当前 的 细 市 性 数据 。ODS 系统 的 数据 组 织 方式 是 基于 主题 的 ， 
它 对 所 有 业务 系统 的 数据 进行 集成 ， 组 成 全 局 共 圣 的 数据 视图 。ODS 系统 的 万 一 个 重要 功能 
就 是 数据 共享 的 功能 ， 它 的 数据 存储 量 取 决 于 对 业务 数据 的 抽取 频率 。ODS 系统 的 数据 具有 
交互 功能 ， 不 仅 所 供 企 业 的 全 局 信息 统一 视图 ， 满 中 对 信息 共 圣 的 需求 ， 同 时 还 可 以 在 固定 
的 周期 内 ， 实 现 决 策 分 析 系 统 与 其 他 业务 系统 之 则 的 交互 。 当 ODS 系统 的 数据 有 更 新 时 ， 外 
围 的 业务 系统 数据 也 会 发 生 相 应 的 变化 。ODS 系统 的 功能 如 图 6-9 所 示 。 


ODS 系统 的 功能 


细 市 、 低 粒度 | ”数据 共享 数据 交互 





















































的 数据 查询 





图 6-9 ODS 系统 的 功能 


总 结 : ODS 系统 是 一 个 面 辣 主题 的 、 集 成 的 、 当 前 的 、 可 更 新 的 数据 集合 ， 用 于 细节 性 
的 合 询 和 为 决 东 分 析 系 统 提 供 当 前 时 间 段 内 的 数据 。ODS 系统 是 介 于 操作 型 数据 库 和 数据 仓 
库 之 间 的 一 种 存储 方式 ， 数 据 仓 库存 储 的 是 概括 性 的 数据 和 历史 数据 ，ODS 系统 存储 的 是 细 
节 性 数据 和 当前 时 间 段 内 的 数据 。 数据 仓库 系统 和 ODS 系统 之 间 的 结合 能 够 分 析 企 业 当 前 的 
运营 情况 ， 同 时 对 未 来 企业 的 经 营 状 况 进 行 合理 的 规划 和 分 析 。ODS 系统 中 的 数据 可 以 进行 
增加 、 删 除 、 修 改 每 操作 ,但 是 数据 仓库 中 的 数据 一 般 不 能 进行 修改 。 数 据 仓库 系统 与 业务 
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系统 相 隅 离 ， 目 的 是 减少 数据 仓库 的 处 理 和 决策 文 持 分 析 对 业务 系统 造成 的 影响 ， 减 少 业 务 
系统 的 压力 。 





6.11 本章 小 结 


1) ODS 有 是 一 个 面 问 主题 的 、 集 成 的 、 可 变 的 、 反 映 当 前 细节 的 数据 集合 。 它 主要 用 于 
文 持 企业 处 理 业 务 应 用 和 存储 面向 主题 的 、 即 时 性 的 集成 数据 ， 为 企业 决策 者 提供 当前 细节 
性 的 数据 ， 通 间作 为 数据 仓库 的 过 流 阶 段 。 

2) ODS 系统 的 主要 功能 :作为 业务 系统 和 数据 仓库 之 间 的 隔离 地 和 市、 降低 业务 系统 的 
压力 、 满 足 从 微观 角度 奋 询 细 世 数据 的 要 求 、 实 时 性 的 数据 整合 功能 、 检 奋 数 据 质量 的 功能 、 
为 企业 提供 统一 的 数据 视图 和 数据 共 圣 的 功能 。 

3) ODS 系统 的 设计 步 又 : 数据 调研 一 确定 数据 范围 一 设计 主题 元 又 一 ODS 系统 的 物理 














4) 建立 基于 ODS 系统 的 即时 OLAP 应 用 是 建立 决 案 分 析 的 一 种 解决 方案 ， 通 单 应 用 于 
中 低级 列 的 决策 分 析 应 用 。 建 立 基 于 数据 仓库 的 OLAP 应 用 是 为 了 进行 长 期 的 趋势 分 析 ， 但 
是 一 般 运 行 较 慢 。 如 来 企业 决策 者 策 要 俘 看 周期 时 间 较 短 的 一 些 指 标 情况 ， 不 需要 太 多 的 历 
史 数 据 ， 这 样 就 需要 建立 基于 ODS 的 即时 OLAP NH. 

5) 数据 库 生 产 系 统 是 操作 型 环境 ， 数 据 分 敌 ， 和 而 ODS 系统 是 耐 丫 主题 的 操作 型 环 寺 。 
通过 定义 ODS 系统 的 表 结 构 ， 数 据 库 系 统 向 ODS 系统 提供 数据 ， 当 ODS 系统 的 数据 发 生变 
化 时 ， 必 须 反 映 到 数据 库 系 统 中 。 

6) ODS 系统 的 逻辑 模型 主要 包括 星 型 模型 、 雪 人 花 型 模型 、 混 合 型 模型 3 种 。 

7) ODS 系统 不 仪 可 以 文 持 多 维 分 析 等 胎 询 功能 ， 还 可 以 满足 对 细 市 性 的 交易 数据 或 者 
粒度 级 别 很 低 的 数据 进行 租 询 。 因 为 ODS 系统 是 按照 面 癌 主题 的 方式 进行 数据 存储 ， 同 时 它 
叉 只 存储 当前 时 间 段 内 的 或 者 接近 当前 的 细 市 性 数据 。 
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第 7 章 ”商业 智能 元 数据 简介 


本 章 目标 
为 了 理解 商业 智能 的 目标 ， 首 移 应 该 熟悉 元 数据 的 基本 知识 。 通 过 本 章 的 和 学习， 我 们 应 
该 了 解 商 业 智 能 元 数据 的 基本 概 您 和 特点 。 
学 习 本 章 后 ， 您 将 学 握 : 
e 元 数据 的 定义 。 
元 数据 的 框架 结构 。 
元 数据 的 类 型 。 
元 数据 的 作用 。 
元 数据 的 管理 。 
元 数据 包含 的 内 容 。 


7.1 元 数据 的 定义 
在 商业 智能 领域 中 ， 元 数据 被 定义 为 :在 数据 仓库 系统 的 建立 、 维 护 、 管 理 和 使 用 
过 程 中 ,用 以 描述 实际 数据 的 信息 ， 是 关于 数据 的 数据 。 在 商业 智能 系统 的 建设 过 程 中 ， 


元 数据 占有 非常 重要 的 地 位 ， 它 不 仅 定 义 了 数据 仓库 的 许多 对 象 ， 例 如 表 结 构 、 所 有 的 
子 段 列 等 属性 ， 还 包括 对 数据 仓库 内 部 数据 流动 和 业务 规则 的 接 述 。 元 数据 的 框 淋 图 如 


7-1 所 示 。 
即席 查询 ， 报 表 ， 
数据 展示 














人 
< 元 
数据 仓库 i 
A 理 


业务 系统 和 外 部 数据 源 
图 7-1 元 数据 的 框 染 图 











7.2 ”元 数据 的 重要 性 


元 数据 在 商业 智能 项 目 中 占有 非常 重要 的 地 位 ， 是 数据 仓库 系统 的 灵魂 和 核心 。 数 据 仓 
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库 系 统 在 建设 的 过 程 中 产生 的 数据 源 定 义 、 转 换 规则 的 定义 、 目 标 库 的 定义 都 存储 在 元 数据 
库 中 。 元 数据 还 文 持 以 下 几 种 功能 : 

1) 朱 述 数据 仓库 系统 存在 哪些 数据 。 

2) 搬 述 哪些 数据 是 在 数据 仓库 系统 中 产生 的 。 

3) 摘 述 哪些 数据 将 要 抽取 到 数据 仓库 系统 中 。 

4) 评估 数据 质量 的 好 坏 。 

5) 记录 数据 抽取 工作 的 执行 情况 。 元 数据 为 企业 建设 数据 仓库 系统 提供 了 详细 的 记录 ， 
并 且 保 证 了 数据 的 一 致 性 和 准确 性 。 因 此 元 数据 对 数据 仓库 系统 的 开发 和 沉 理 是 非常 重要 的 ， 
共有 决定 性 的 意义 。 














7.3 “元 数据 的 类 型 
元 数据 主要 包括 技术 元 数据 和 业务 元 数据 ， 如 图 7-2 所 示 。 


。 存储 数据 仓库 系 
统 技术 细 市 方面 
的 数据 

« 存储 数据 仓库 开 
发 和 管理 使 用 的 


数据 
o 存储 ETL 数据 抽 


。 存储 数 据 的 来 源 
e 存储 数据 的 访问 


原则 


e 存储 系统 提供 的 


决策 分 析 方 法 


。 人 存储 报表 展示 的 


信息 


取 的 映射 关系 和 
转换 规则 
e 存储 数据 仓库 模 
式 的 定义 
。 存储 计 算 的 方法 





图 7-2 元 数据 的 类 型 


技术 元 数据 (Technical Metadata). 主要 存储 数据 仓库 系统 技术 细 市 方面 的 数据 。 主 要 包 
括 数 据 仓库 开发 和 管理 使 用 的 数据 ，ETL 数据 抽取 的 映射 关系 和 转换 规则 ， 对 数据 仓库 模式 
的 定义 ， 计 算 的 方法 等 内 容 。 

业务 元 数据 (Business Metadata) 从 业务 角度 描述 了 商业 智能 系统 中 的 数据 。 业 务 元 数据 
包括 以 下 信息 : 数据 的 来 源 ， 数 据 的 访问 原则 ， 系 统 提 供 的 决策 分 析 方 法 ， 报 表 展 示 的 信息 
等 内 容 。 业 务 人 员 可 以 通过 业务 元 数据 了 解数 据 仓 库 内 部 的 信息 。 


7.4 元 数据 的 作用 


元 数据 的 作用 如 图 7-3 Pro 
CO 帮助 用 户 理 解数 据 仓库 系统 中 的 数据 
在 使 用 数据 仓库 时 ， 元 数据 可 以 帮助 用 户 理解 数据 仓库 中 包含 的 所 有 内 容 。 例 如 ， 用 户 
在 进行 数据 分 析 时 ， 需 要 查看 元 数据 的 内 容 ， 因 为 元 数据 包含 了 从 数据 源 到 数据 仓库 中 的 映 
射 关系 ， 数 据 从 源 到 目标 的 过 程 中 ， 经 历 了 清洗 、 转 换 、 汇 上 总、 计算、 过 滤 等 变化 ， 元 数据 
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能 及 时 地 跟踪 这 些 数据 变化 ， 包 丘 数 据 结 构 发 生 的 变化 ， 而 用 户 利 用 元 数据 去 理解 数据 仓库 
系统 中 发 生变 化 的 这 些 数据 ， 这 是 元 数据 的 一 个 重要 功能 。 一 上 般 情况 下 ， 普 通用 户 不 熟悉 数 
据 仓 库 的 技术 ,而 元 数据 可 以 帮助 这 些 用 户 理解 数据 仓库 中 的 数据 含义 和 如 何 使 用 这 些 数 据 ， 
征用 户 和 数据 仓库 之 间 沟 通 的 桥 桨 。 

(2) 用 于 数据 仓库 系统 的 集成 

数据 仓库 是 面 回 主题 的 、 集 成 的 。 在 数据 仓库 的 实施 过 程 中 ， 通 过 元 数据 的 管理 ， 鬼 照 
统一 的 数据 模型 ， 将 数据 集成 到 数据 仓库 中 ， 同 时 将 数据 源 与 数据 仓库 的 映射 关系 和 转换 规 
则 存储 在 元 数据 库 中 ， 这 也 是 元 数据 的 重要 功能 之 一 。 

(3) 你 证 数据 的 质量 

元 数据 定 理 可 以 使 数据 仓库 设计 人 员 和 开发 人 员 对 数据 流程 和 转换 规则 的 定义 有 一 个 清 
晰 的 认识 ， 方 便 对 数据 质量 的 控制 ， 也 能 迅速 友 现 哪些 地 方 存 在 问题 。 相 对 于 最 终 用 户 来 说 ， 
元 数据 也 会 帮助 他 们 对 数据 的 整体 流程 ， 包 括 数 据 抽 取 、 清 洗 、 转 换 、 加 和 载 的 规则 有 一 个 大 
概 的 认识 ， 可 以 对 数据 质量 有 一 个 正确 的 评 信 。 

(4) 所 高 数据 仓库 系统 的 灵活 性 

在 数据 仓库 系统 中 ， 元 数据 定义 了 物理 表 的 结构 、 列 属性 、 业 务 规 则 ， 包 括 数据 抽取 的 
规划 、 决 集 分 析 每 内 容 ， 在 整个 商业 智能 项 目 开 发 过 程 中 占有 重要 的 地 位 。 

随 看 企业 的 发 展 变化 ， 利 用 元 数据 可 以 将 整体 的 工作 流 、 数 据 流 管理 起 来 ， 适 应 企业 需 
求 的 变化 和 扩展 ， 有 效 提高 了 数据 仓库 系统 的 扩展 性 和 灵活 性 。 
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图 7-3 元 数据 的 作用 


7.5 ”元 数据 的 管理 


元 数据 的 管理 包含 以 下 几 个 方面 的 内 容 : 

1 ) 确定 每 个 实体 的 属性 和 实体 与 实体 之 间 的 关系 ， 退 踩 实体 发 生变 化 时 对 全 局 造成 的 影 啊 。 

2) 通过 元 数据 的 管理 机 制 ， 有 效 管理 数据 仓库 系统 的 整体 流程 ， 提 高 系统 的 扩展 性 和 项 
目 管 理 的 效率 ， 降 低 项 目 失败 的 风险 。 
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3) 通过 元 数据 的 管理 ， 决 定 系统 中 的 哪些 数据 需要 更 新 ， 以 及 更 新 的 方式 。 
7.6 元 数据 包含 的 内 容 
元 数据 主要 包含 以 下 儿 个 方面 的 内 容 ， 对 数据 库 方面 的 描述 ， 对 实体 的 属性 和 实体 之 间 


关系 的 接 述 ， 对 数据 库 中 各 种 物理 表 、 表 之 间 的 关系 和 属性 的 接 述 ， 数 据 流 动 的 插 述 ， 各 种 
维度 的 摘 述 等 。 元 数据 包含 的 主要 内 容 如 图 7-4 Dr. 


n 对 数据 库 方面 的 描述 ， 包 括 各 种 对 象 和 对 象 属性 的 定义 p 
m 对 实体 的 属性 和 实体 之 间 的 关系 进行 描述 ME 





E 对 数据 库 中 各 种 物理 表 、 表 之 间 的 关系 和 属性 进行 描述 E 
K 对 各 种 维度 、 层 次 、 度 量 值 进行 描述 E 
[p 对 ETL 过 程 中 产生 的 映射 关系 、 转 换 规则 、 数据 的 流动 进行 描述 EN 





图 7-4 元 数据 包含 的 主要 内 容 





7.7 ”本章 小 结 


1) 在 商业 知 能 领域 中 ， 元 数据 被 定义 为 : 在 数据 仓库 系统 的 建立 、 维 护 、 害 理 和 使 用 过 
程 中 ， 用 以 揪 述 实际 数据 的 信息 ， 是 关于 数据 的 数据 。 

2) 元 数据 在 商业 智能 项 目 中 占有 非常 重要 的 地 位 ， 是 数据 仓库 系统 的 灵魂 和 核心 。 

3) 元 数据 主要 包括 技术 元 数据 和 业务 元 数据 。 

4) 元 数据 的 作用 包括 : 帮助 用 户 理 解数 据 仓 库 系 统 中 的 数据 , 用 于 数据 仓库 系统 的 集成 ， 
你 证 数据 的 质量 ， 提 高 数据 仓库 系统 的 灵活 性 。 
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第 8 章 商业 智能 项 目 需求 的 定义 


本 章 目标 

从 本 革 开 始 进 入 到 项 目 篇 ， 我 们 以 实际 项 目 为 基础 ， 依 托 商业 智能 理论 知识 ， 详 细 介 
绍 商 业 智 能 项 目的 每 个 实施 过 程 ， 包 丘 项 目的 局 动 、 需 求 的 定义 、 系 统 的 设计 、 系 统 的 开 
发 和 测试 、 系 统 上 线 到 验收 等 内 容 。 本 音 重 点 介绍 项 目的 局 动 过 程 和 需求 的 定义 。 

学 习 本 划 后 ， 您 将 掌握 ; 

e 商业 智能 项 目的 司 动 步 又 。 

e 商业 智能 项 目的 需求 定义 过 程 。 

e 需求 调研 的 方式 。 

e 如 何 制订 商业 智能 项 目的 调研 计划 。 

e 系统 原型 的 建立 条 件 。 

e 验收 和 评审 包含 的 内 容 。 

















8.1 Tél es BEI H BRI 





As. AA Bex H AASE EA H VEURHIJZHZRORUESS, TAMH Teo MEN H 
成 员 的 工作 范围 ， 制 订 项 目 计 划 和 实施 步骤 ,确定 项 目 管 理 的 规范 和 流程 ， 确 定 项 目的 质量 
规范 和 要 求 ， 召 开 项 目 局 动 会 ， 人 确定 项 目 害 要 交付 的 成 果 ， 确 定 项 目 成 员 的 角色 及 其 主要 工 
作 内 容 等 ， 如 图 8-1 所 示 。 

下 面 介绍 商业 智能 项 目 启动 过 程 的 主要 步 又 。 

(OD 项 目 资 源 的 组 织 和 管理 

商业 智能 项 目的 管理 者 通常 需要 了 解 项 目的 资源 如 何 组 织 和 管理 。 如 图 8-2 Pr. 
项 目 资源 的 组 织 和 管理 包括 项 目 需 要 的 运行 环境 和 开发 环境 ， 所 需要 的 软 便 件 设 备 和 其 
他 配套 设施 等 内 容 。 其 根本 目的 是 在 项 目 实施 中 根据 项 目 需要 的 人 力 和 设备 资源 结合 项 
目的 进度 、 计 划 和 工作 安排 ， 由 项 目 经 理 或 者 项 目 管 理 者 列 出 详细 的 项 目 计 划 资 源 使 用 
( 见 图 8-3). 

(2) 项 目的 背景 

首先 需要 介绍 甲 方 公司 的 社会 背景 、 主 营业 务 及 其 公司 软 硬 件 实力 等 信息 ; 然后 介绍 本 
次 项 目 需要 完成 哪些 功能 模块 ， 参 考 了 哪些 成 果 ， 采 纳 了 哪些 意见 ， 借 鉴 了 哪些 行业 的 经 验 


^ s 
等 信息 。 
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资源 的 组 






商业 智能 
项 目的 启动 






确定 项 目 
成 员 的 
工作 范围 


HiT m H 
计划 和 










管理 的 规 
VERDE 


图 8-1 商业 智能 项 目的 司 动 过 程 
系统 的 开发 环境 


* Windows XP/Windows 2003 
s CPU. EFi 2.0GHz 


系统 的 运行 环境 
* Windows XP/Windows 2003 
* CPU; 主 频 2.0GHz 
以 上 
. 内存，10GB 
s 硬盘，80GB 


-. 10GB 
. [i8 Zr. 80GB 


X ys e 数据库: 


Oracle 10g Oracle 10g 


| 项 目的 工具 列表 


HORRETA. Informatica 8.1 
. 数据 分 析 工 具 ，Cognos 8.3 








K|8-2 资源 的 组 织 和 管理 


进度 时 间 
图 8-3 ”项 目 计 划 的 资源 使 用 图 

(3) 人 确定 项 目 成 员 的 工作 范围 

完成 商业 智能 项 目 主要 包括 需求 分 析 、 数 据 模型 的 设计 、 数 据 模 型 的 物理 实现 、ETL x 
计 和 实现 、 数 据 分 析 和 报表 展示 功能 的 设计 和 实现 ， 由 此 划分 项 目 组 成 员 的 工作 范围 。 

(4) 确定 项 目 需要 交付 的 成 果 

一 般 来 说 ， 商 业 智能 项 目 需要 交付 的 成 果 包 括 商 业 智 能 软件 系统 、 技 术 开 发 文档 、 测 试 
说 明文 档 、 商 业 智 能 项 目 管 理 文档 ， 如 图 8-4 rn. 





IT 


商业 智能 
软件 系统 






商业 智能 








测试 说 明 
文档 


图 8-4 商业 智能 项 目 需要 交付 的 成 末 





其 中 ， 技 术 开 友 文 档 包 括 系统 实施 方案 、 需 求 说 明 书 、 系 统 概要 设计 说 明 书 、 系 统 话 细 


设计 说 明 书 、 数 据 库 设计 说 明 书 、 用 户 手 册 、 维 护 手册 等 文档 ;测试 说 明文 档 包括 测试 用 例 
及 其 测试 说 明报 告 等 文档 ， 商 业 智能 项 目 管理 文档 包括 项 目 开 发 的 进度 报告 和 项 目 开发 计划 
书 ， 以 及 项 目的 验收 报告 。 











(5) 项 目 组 的 成 员 角 色 及 主要 工作 内 容 

业 知 能 项 目 一 般 包 括 以 下 成 员 及 其 角色 ， 如 图 8-5 Pra. 

1) 业务 组 成 员 : 包括 项 目 负责 人 人、 业务 负 责 人 、 技 术 负 责 人 。 

2) 开发 组 成 员 : 包括 总 体 协调 、 总 体 撤 术 负责 、 总 体 业务 指 寻 、 项 目 实施 经 理 、 技 术 开 











发 经 理 、 平 合 开 发 经 理 、 客 户 经 理 、ETL 开发 工程 师 、 展 示 平 台 开 发 工程 师 、 关 工 、 系 统 维 
护 工程 师 。 
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。 项 目 负责 人 。 总 体 协 调 

。 业务 负 贡 人 。 总 体 技术 负责 

。 技 术 负 责 人 。 总 体 业务 指导 
。 项 目 实施 经 理 
。 技 术 开 发 经 理 


。 平台 开发 经 理 

。 客户 经 理 

* ETL 开发 工程 师 

。 展示 平台 开发 工程 师 
。 美工 

。 系统 维护 工程 师 





图 8-5 项 目 组 的 成 员 及 其 角色 








总 体 协调 主要 负责 审批 商业 智能 项 目 方案 和 计划 的 可 行 度 , 调配 项 目 成 员 , 提供 人 力 、 
财力 和 一 些 必要 的 配套 设施 。 

总 体 技术 负责 主 要 是 针对 商业 智能 项 目 制订 项 目 方案 、 计 划 ; 负 贡 项 目 实施 工作 ， 协 
调和 管理 项 目 成 员 ， 包 括 与 业务 人 员 的 工作 协调 和 沟通 ， 负 责 商 业 知 能 扩 术 塔 训 和 业 
务 分 析 、 系 统 整 体 的 设计 。 











e KARTE TER EEA MAIRA AE. ARAKEA PoCRUCAS AN 18 E24] 388 9) 
调 ， 把 握 整 体 业务 的 流程 。 

e 项 目 实施 经 理 主要 是 负责 需求 调研 、 分 析 开 有 友 、 实 施 , 包括 以 后 的 测试 、 维 护 等 工作 。 

e 技术 开 肥 经 理 主要 负责 需求 分 机 、 概 要 设计 、 详 细 设 计 、 数 据 库 设 计 、 数 据 库 建 梗 、 

功能 设计 、 数 据 库 管 理 功能 开发 等 工作 。 

平台 开发 经 理 主要 负责 平台 页 面 的 展示 功能 。 

客户 经 理 主要 负责 商业 智能 项 目 中 与 客户 的 沟通 。 

ETL 开发 工程 师 主 要 负责 商业 知 能 项 目 数据 库 、 文 件数 据 抽 取 的 设计 与 开发 。 

展示 平台 开发 工程 师 主 要 负责 商业 智能 项 目 展示 平台 的 研发 ， 包 括 开 发 报表 的 展 

示 切 能 。 

美工 主要 负 贡 整体 系统 页 面 的 设计 和 规划 。 

系统 维护 工程 师 主要 负责 系统 的 运行 和 维护 。 


8.2 ”商业 智能 项 目的 需求 定义 


需求 分 析 是 商业 智能 项 目的 第 一 步 ， 通 常 包括 需求 采集 和 需求 分 析 。 需 求 采集 是 针对 用 
户 所 能 提供 的 大 方向 以 及 部 分 需求 ， 去 预见 以 后 的 需求 ， 需 求 分 析 是 在 需求 采集 过 程 中 ， 根 
据 调 研 大 纲 ， 充 分 了 解 企业 不 同 层次 人 员 的 需求 ， 并 且 对 需求 进行 仔细 的 分 析 、 总 结 、 归 纳 、 
整理 ， 形 成 一 份 准确 的 需求 分 析 报 告 。 同 时 为 了 减少 用 户 需 求 的 变更 ， 能 够 了 解 用 户 的 真实 
需求 ， 可 以 采用 多 种 方式 进行 调研 ， 例 如 通过 问卷 或 者 会 议 的 形式 进行 记录 。 需 求 分 析 也 是 
一 个 经 过 不 断 循环 、 反 馈 和 不 断 完善 的 过 程 ， 只 有 这 样 才能 得 到 明确 而 详细 的 需求 。 

F 面 是 对 需求 各 阶段 的 详细 介绍 。 

1， 需 求 调研 问卷 设计 

需求 调研 问卷 是 根据 问卷 中 的 问题 和 最 终 用 户 的 回答 ， 提 取 相应 的 内 容 ， 并 且 进 行 详细 
的 统计 分 析 和 整理 ， 形 成 比较 完整 的 需求 信息 资料 ， 从 而 得 到 用 户 最 真实 的 需求 。 调 研 问 卷 
设计 应 遵循 问卷 的 合理 性 、 全 面 性 、 简 单 性 、 易 扩充 性 等 原则 ORE 8-6)， 以 便 在 调研 时 整 


JH E T. 























































































































图 8-6 调研 问卷 设计 的 原则 
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e 合理 性 是 指 问卷 的 设计 需要 与 相关 业务 保持 一 致 性 。 
e 简单 性 是 指 在 问卷 过 程 中 尽 可 能 地 减少 业务 人 员 的 工作 量 ， 通 过 最 简单 的 形式 获得 业 
务 人 员 更 深层 次 的 需求 。 
e 另 扩 充 性 是 指 提供 灵活 的 处 理 手 段 ， 使 调研 对 象 可 以 比较 清楚 地 回答 调研 问题 。 
e 全 面 性 是 指 调研 问题 设计 应 该 全 面 复 盖 所 有 的 相关 业务 ， 使 需求 调研 人 员 能 够 清楚 地 
获取 需要 的 调研 结果 ， 使 问卷 成 为 一 个 相对 完整 的 整体 。 

， 需 求 调 研 问 卷 内 容 

针对 商业 智能 项 目的 调研 主要 包括 以 下 几 个 方面 : 

1) 目前 业务 系统 的 现状 熟悉 业务 系统 的 编码 标准 和 当前 系统 的 应 用 现状 。 

2) 业务 数据 库 的 基本 信息 : 搜集 数据 库 系统 的 版 本 、 操 作 系统 的 版 本 、 当 前 的 数据 量 和 
数据 的 保存 方式 。 

3) 数据 字典 的 信息 : 搜集 业务 数据 库 中 数据 结构 的 信息 。 例 如 ， 表 、 视 图 的 结构 说 明 ， 
所 有 列 、 主 键 、 外 键 、 索 引 的 基本 信息 ， 这 些 信 息 保 证 了 数据 抽取 的 设计 和 开发 。 

4) 测试 数据 的 搜集 : 为 了 保证 测试 的 准确 性 ， 搜 集 当 前 系统 的 真实 数据 供 系 统 开 发 环 
境 和 测试 环境 使 用 ， 并 且 遵 循 以 下 原则 : 编码 表 的 数据 不 能 缺失 ; 事实 表 的 数据 字段 不 能 
缺失 ， 并 且 保 证 编码 字段 不 能 被 修改 。 一 般 来 说 ， 测 试 数 据 是 真实 数据 的 一 半 左 右 ， 同 时 
各 个 业务 系统 的 数据 时 间 段 尽量 保持 统一 ， 例 如 搜集 某 生 产 系统 的 数据 时 间 段 是 2008 年 1 
月 到 2011 年 1 月 ， 而 搜集 某 营 销 系统 的 数据 时 间 段 仍然 是 2008 年 1 月 到 2011 年 1 月 这 
样 会 保证 开发 和 测试 的 准确 性 ， 同 时 搜集 的 历史 数据 应 该 至 少 2 一 3 年 。 测 试 数据 的 搜集 原 
则 如 图 8-7 所 示 。 







































































编码 表 的 数 
据 不 能 缺失 








事实 表 的 数 














历史 数据 应 该 测试 数据 的 据 字段 不 能 
至 少 2~3 年 搜集 原则 缺失 ， 编 码 





字段 不 能 被 
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各 个 业务 系 
统 的 数据 时 
间 段 尽量 保 


持 统 一 


图 87 测试 数据 的 搜集 原则 


5) ETL 需求 调研 : 主要 以 问 爷 的 形式 对 数据 抽取 、 转 换 、 加 载 的 需求 进行 调研 。 问 疮 的 
内 容 通 币 包括 指标 项 、 数 据 获 取 的 频率 、 数 据 获 取 的 方式 ， 以 及 备注 等 内 容 。 例 如 ， 以 问 郊 
的 形式 对 铭 户 进行 调研 ， 获 取 工 业 耗 电量 、 民 用 耗 电量 、 其 他 类 型 的 耗 电量 3 个 指标 数据 的 
80 


























获取 频率 (年 、 季 、 月 、 日 、 小 时 )、 获 取 方 式 〈 数 据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 ) 等 
Tei E, 见 表 8-1 o 


表 8-1. FAH ETL 需求 调研 示例 








指 标 项 数据 获取 频率 数据 获取 方式 To - 注 
工业 耗 电量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 
民用 耗 电量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 








其 他 类 型 的 耗 电 量 年 季 月 日 小 时 数据 库 直 接 读 取 、 文 本 文件 或 其 他 方式 


6) 主题 分 析 需 求 调 研 : 主题 分 析 和 需求 调研 的 示例 如 图 8-8 所 示 。 由 该 图 可 看 出 ， 人 员 
基本 信息 主题 域 包括 人 员 冢 姓 成 员 信息 、 人 员 职 位 信息 、 人 员工 作 经 历 信息 、 人 员 社 会 天 
系 信 息 、 人 员 教 育 育 景 信息 、 人 员 通 信 地 址 信息 、 人 员 社 会 你 险 信息 等 内 容 。 我 们 以 问 矢 
调研 的 形式 得 到 哪些 层次 的 客户 人 员 关 心 该 主题 域 ， 如 何 获得 该 主题 域 的 数据 、 该 主题 域 
中 数据 的 频率 是 多 少 、 关 注 该 主题 域 的 企业 对 象 有 哪些 、 针 对 该 主题 域 的 维度 分 析 有 哪些 


等 内 容 。 

















图 8-8 ”人员 基本 信息 主题 域 





以 下 是 关于 人 员 基 本 信息 主题 域 的 问 耸 示例 。 

1) 您 是 耕 关 心 该 主题 域 ? 

口 是 ; 

Oe 

2) 获得 该 主题 域 数 据 的 情况 : 

口 能 够 从 业务 系统 中 获得 该 主题 的 所 有 数据 ; 

口 可 获得 业务 系统 中 的 部 分 数据 , 请 详细 说 明 可 以 获得 哪些 数据 ; 
口 从 业务 系统 中 不 能 获得 任何 数据 ; 











口 其 他 情况 , 请 详细 说 明 。  ， 
3) 获得 该 主题 域 中 数据 的 频率 是 多 少 ? 

ME, 

口 季 ; 

1; 


7 


OH; 

口 小 时 ; 

口 分 钟 ; 

口 实时 。 

4) 关注 该 主题 域 的 企业 对 象 : 
口 公司 领导 诀 胰 人 员 ; 








口 公司 中 层 管 理 人 员 ; 
口 公司 业务 人 员 ; 


口 其 他 人 员 ， 请 详细 说 明 : 
5) 针对 该 主题 域 的 维度 分 析 : 
口 按时 间 维 虚 ; 
口 按 地 区 维度 ; 
口 按 电压 每 级 维度 ; 
口 其 他 ， 请 详细 说 明 : 
3. 制订 商业 智能 项 目的 调研 计划 
制订 调研 计划 主要 包括 : 完成 整个 调研 过 程 中 的 工作 任务 分 配 ， 工 作 时 间 的 安排 ， 资 源 
的 调度 ， 以 及 调研 的 目标 等 内 容 。 在 进行 需求 分 析 乙 前 ， 需 要 制订 详细 完备 的 调研 计划 ， 目 
的 是 安排 好 调研 的 侧重 点 ， 以 及 其 话 细 的 调研 步骤 。 在 制订 调研 计划 的 时 候 ， 同 样 需 要 说 明 
调研 的 背景 、 调 研 的 目标 、 调 研 的 范围 以 及 各 种 调研 的 方式 等 内 容 ， 这 梓 有 利于 调研 人 员 有 
的 放 和 天， 对 调研 工作 做 好 充分 的 准备 。 调 研 计划 可 以 分 成 以 下 儿 个 步骤 : 
(1) 确定 调研 目标 
确定 调研 目标 可 以 有 多 种 方式 。 例 如 ， 通 过 填写 调研 调查 表 或 者 会 议 座谈 的 形式 对 业务 
需求 进行 调研 、 整 理 和 记录 ; 同时 让 企业 领导 、 中 层 管理 人 员 、 业 务 人 员 、 商 业 智 能 项 目 组 
的 开发 设计 人 员 在 此 期 间 达 成 共识 。 在 对 应 用 系统 进行 调研 时 ， 和 需要 全 和 面 了 解 当 前 系统 的 各 
种 信息 资源 ， 包 括 数 据 的 来 源 、 数 据 生成 的 时 间 和 频 这 等 信息 。 同 样 ， 可 以 将 其 他 行业 成 功 
的 案例 作为 学 习 的 模板 。 
(2) 确定 人 员 组 织 结构 
确定 项 目的 人 员 组 织 结构 是 为 了 保证 甲 方 和 乙方 人 员 之 间 的 配合 。 例 如 ， 在 商业 智能 项 
目 实施 初期 ， 乙 方 需 要 项 目 经 理 制 订 项 目 工作 的 计划 ， 制 订 资 源 使 用 计划 ， 协 调 各 部 门 之 间 
的 配合 ， 把 握 项 目的 进度 ， 甲 方 业务 顾问 需要 为 乙方 人 员 提 供 籽 务 方面 的 指导 ， 需 求 分 机 人 
员 需 要 对 项 目 需 求 进行 采集 和 调研 ， 系 统 染 构 人 员 对 项 目 整 体 架 构 进 行 分 析 和 规划 ， 开 发 人 
员 主 要 负责 商业 智能 系统 的 设计 与 实现 。 
4. 调研 方式 
(1) 会 议 或 访谈 的 形式 
在 开始 访谈 之 前 ， 应 该 预定 好 访问 的 时 间 和 地 点 ， 确 定 参 会 人 员 及 其 各 方 主要 负责 人 ， 
包括 双方 需要 做 哪些 准备 工作 等 内 容 。 在 访谈 的 时 候 ， 需 要 与 相关 业务 人 员 进 行 交 流 ， 乙 方 
需要 根据 调研 大 纲 的 内 容 进行 有 的 放 矢 的 提问 ， 无 论 是 甲 方 人 员 还 是 乙方 人 员 ， 都 需要 进行 
详细 的 记录 和 分 机 。 调 研 的 内 容 可 以 包括 当前 应 用 系统 的 实际 现状 和 数据 资源 的 配置 情况 。 
在 访谈 结束 时 ， 应 该 形成 统一 风格 的 文档 ， 以 备 后 来 的 需求 分 析 使 用 。 
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5. 调研 的 内 容 和 形式 

在 需求 调研 过 程 中 ， 需 要 了 解 企 业 不 同 层次 人 员 的 业务 需求 ， 包 括 企业 的 领导 决策 层 、 
中 间 管 理 屋 、 各 个 业务 部 门 的 相关 人 员 和 技术 人 员 ， 如 图 8-9 所 示 。 针 对 不 同 的 调研 对 象 ， 
调研 的 侧重 点 也 有 所 不 同 。 




















针对 领导 





图 8-9 调研 的 内 容 和 形式 


CD 针对 领导 决策 层 

e 需要 了 解 领 导 决策 层 关注 哪些 主题 和 哪些 重点 指标 。 

e 在 当前 业务 系统 中 ， 领 导 决 策 层 以 何 种 方式 获取 这 些 指标 。 

e 领导 决策 层 硕 望 这 些 重 点 指标 的 展现 方式 是 什么 ， 以 及 目前 指标 的 展现 方式 是 什么 。 

e 领导 决策 层 硕 望 这 些 重 点 指标 关联 哪些 维度 进行 多 维 展示 。 

e 领导 决策 层 硕 望 获得 数据 仓库 系统 中 的 哪些 决策 分 析 功 能 。 

e Jic URBE imo Hil ie eb. 

(2) 针对 中 间 管 理 层 

e 和 震 要 了 解 中 间 管 理 人 员 关 心 哪些 指标 和 主题 。 

e 和 震 要 了 解 中 间 管 理 层 人 员 目 前 以 何 种 方式 获取 这 些 指标 值 。 

e 和 震 要 了 解 中 间 管 理 层 人 员 和 希望 得 到 这 些 指标 的 展现 方式 是 什么 ， 以 及 目前 指标 的 展现 
AAA. 

e 中 间 管 理 层 人 员 对 商业 智能 决策 分 析 系 统 的 期 望 是 什么 。 

e 中 间 管 理 层 人 员 希 望 关 注 的 这 些 指标 关联 哪些 维度 进行 多 维 展示 。 

e 中 间 管 理 层 人 员 和 硕 望 关注 的 这 些 指标 的 最 小 粒度 是 多 少 。 

(3) 针对 业务 人 员 

e 需要 了 解 业 务 人 员 平 时 最 常用 的 指标 是 哪些 。 

e 业务 人 员 最 关心 的 主题 是 哪些 。 

e 业务 人 员 硕 望 得 到 数据 仓库 系统 的 哪些 决策 分 析 功 能 。 
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e 业务 人 员 和 希望 关心 的 这 些 指标 关联 哪些 维度 进行 多 维 展示 。 

e 业务 人 员 和 希望 关注 的 这 些 指 标的 最 小 粒度 是 多 少 。 

(A) 针对 技术 人 员 

e 技术 人 员 平 时 最 第 用 的 指标 是 哪些 。 

e 技术 人 员 最 关心 的 主题 是 哪些 。 

e 了 了解 目前 业务 系统 的 数据 结构 。 

e 了 解 当 六 系统 的 数据 刷新 频率 是 多 少 。 

e 了 解 当 六 系统 的 数据 源 来 目 于 哪些 业务 系统 。 

6. 商业 智能 项 目 需求 的 总 结 与 整理 

对 需求 的 总 结 与 整理 是 指 根 据 调 研 得 到 的 信息 进行 分 析 、 归 纳 、 整 理 ， 得 出 商业 智能 项 
目的 相关 需求 。 需 求 中 包括 对 现 有 应 用 系统 、 各 种 信息 资源 和 决策 分 析 系 统 之 间 关 系 的 详细 
描述 和 总 结 。 

7. 需求 说 明 书 的 编写 

需求 分 析 说 明 书 中 包括 对 本 次 商业 智能 项 目的 调研 计划 、 调 研 上 和 目标、 调研 范围 和 调研 的 
方法 、 内 容 等 信息 的 详细 描述 。 同 时 描述 该 商业 智能 系统 生成 哪些 数据 ， 生 成 的 时 间 和 频率 
是 多 少 ， 在 需求 说 明 书 中 还 需要 列 出 不 同 需求 的 数据 来 自 于 哪些 业务 系统 。 

8. 逻辑 分 析 说 明 书 的 编写 

逻辑 分 析 过 程 是 通过 调研 获取 的 资料 去 分 析 各 种 信息 资源 ， 包 括 定 义 分 析 的 角度 、 指 标 
以 及 这 些 指标 的 数据 来 源 等 信息 。 整 个 逻辑 分 析 过 程 由 数据 仓库 设计 开发 人 员 和 业务 人 员 一 
起 完成 。 逻 辑 分 析 的 过 程 是 一 个 不 断 完 善 和 项 目 迭 代 的 过 程 。 针 对 每 一 个 主题 进行 分 析 时 ， 
都 需要 考虑 已 经 完成 的 主题 分 析 和 尚未 完成 的 主题 。 

下 面 以 用 户 用 电 从 费 情况 主题 为 例 ， 说 明 如 何 进行 需求 的 逻辑 分 析 。 为 了 实现 用 电 户 的 从 费 
总 额 、 本 年 欠 费 、 两 年 以 内 从 费 、 两 年 及 两 年 以 上 从 费 、 本 年 应 收费 用 、 本 年 累计 实 收费 用 等 指 
标 在 不 同 地 区 、 时 间 、 供 电 单 位 等 维度 的 多 角度 分 析 ， 需 要 在 某 电 力 销售 系统 的 业务 处 理 馆 辑 上 
进行 分 析 。 风 辑 分 析 说 明 书 的 编写 包括 需求 分 析 、 数 据 源 描述 、 业 务 逆 辑 处 理 方 法 等 内 容 。 

(1) ARD SO 

从 费 总 额 是 指 用 电 户 从 费 的 总 额 。 

(2) 本 年 欠 费 

本 年 欠 费 是 指 用 电 户 按 本 年 上 度 汇总 计算 得 出 的 欠 费 总 额 。 

(3) 两 年 以 内 从 费 

在 用 电 户 欠 旨 中， 两 年 以 内 欠 费 总 和 。 

(4) 两 年 及 两 年 以 上 从 费 

在 用 电 户 欠 弗 中， 两 年 以 上 的 欠 费 总 和 。 

(5) 本 年 应 收费 用 

在 未 收 电费 中 ， 本 年 的 从 费 总 额 。 

(6) 本 年 累计 实 收 费用 

本 年 各 月 实 收 费用 之 和 。 

CT) 地 区 

地 区 维度 一 般 分 成 省 级 、 地 市 、 县 级 3 种 维度 。 
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(8) 时 间 

大 多 数 的 电力 公司 采用 按 月 人 工 抄 表 的 方式 进行 计 费 ， 时 间 维 度 一 般 是 按 月 计算 费用 ， 
然后 由 月 进行 季度 汇总 ， 由 季度 进行 年 度 汇总 。 

(9) 供电 单位 

供电 单位 包括 省 电力 公司 、 地 市 电力 公司 或 者 县 级 电力 公司 等 。 

总 结 : 在 对 系统 进行 需求 分 析 时 ， 需 要 考 碟 各 个 业务 系统 的 数据 是 否 满足 过 辑 分 析 的 需 
要 ， 包 括 数据 产生 的 周期 和 数据 质量 等 内 容 。 

商业 智能 项 目的 需求 定义 过 程 如 图 8-10 Br 




















制订 商业 智能 
项 目的 调研 
计划 


调研 的 内 容 和 
形式 





逻辑 分 析 谨 明 
书 的 编写 





图 8-10 ”商业 智能 项 目的 需求 定义 过 程 


8.3 ”系统 原型 的 建立 








系统 原型 是 在 需求 分 析 的 基础 上 ， 经 过 业务 人 员 和 开发 人 员 共 同 协商 建立 起 来 的 ， 为 以 
后 的 系统 开发 、 测 试 和 系统 实施 上 线 打下 了 基础 。 使 用 系统 原型 的 条 件 如 图 8-11 所 示 。 
考虑 使 用 系统 原型 不 适合 使 用 系统 原型 
模型 的 情况 模型 的 情况 
。 需 求 定义 模糊 用户 需求 已 经 明确 ， 





。 需 求 改变 的 可 能 性 并 有 相应 的 文档 支持 
不 断 增 大 。 商 业 智 能 系统 划分 成 
。 项 目 开 发 风险 大 ， 各 个 独立 的 模块 

费用 高 e 系统 开发 的 工作 量 大 





图 8-11 使 用 系统 原型 的 条 件 


8.4 ”验收 和 评审 的 内 容 


验收 包括 技术 文件 清单 、 申 请 验收 单位 的 意见 、 审 批 的 意见 等 内 容 。 评 审 方式 主要 包括 
会 议 式 、 传 阅 式 、 批 准 式 评审 。 评 审 的 内 容 包括 业务 需求 、 功 能 需求 、 非 功能 需求 等 。 评 审 
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的 结论 有 3 种 情况 : 

1) 通过 评审 ， 可 以 进入 下 一 阶段 。 

2) 原则 通过 ， 修 改 后 进入 下 一 阶段 。 

3) 未 通过 评审 ， 修 改 后 重新 评审 。 

在 评审 过 程 中 需要 参评 人 和 评审 组 长 。 在 评审 过 程 中 ， 需 要 确定 评审 的 方式 、 评 审 的 对 
象 ， 最 后 得 出 评审 的 结束 ， 包 括 工 作成 豆 是 售 合 格 、 评 审 意 匈 和 评审 组 长 的 签字 。 





8.5 kx 





15 商业 智能 项 目的 局 动 包括 项 目 资源 的 组 织 和 管理 ， 了 解 项 目 背 景 ， 确 定 项 目 成 员 的 
工作 范围 ， 制 订 项 目的 计划 和 实施 的 步 又 ， 确 定 项 目 管理 的 规范 和 流程 ， 确 定 项 目的 质量 
规范 和 要 求 ， 召 开 项 目 局 动 会 ， 确 定 项 目 需 要 交付 的 成 果 ， 确 定 项 目 成 员 角 色 及 其 主要 工 
作 内 容 。 

2) 需求 分 析 是 商业 智能 项 目的 第 一 步 ， 通 党 包括 需求 的 采集 和 对 需求 的 分 析 。 

3) 需求 调研 问卷 设计 的 原则 : 合理 性 、 全 面 性 、 简 单 性 、 易 扩充 性 。 

4) 调研 方式 : 会 议 或 访谈 的 形式 、 问 耸 调 得 的 形式 。 

5) 在 需求 调研 过 程 中 , 需要 了 解 企 业 不 同 层 次 人 员 的 业务 需求 , 包括 企业 的 领导 决策 层 、 
中 间 管 理 层 、 各 个 业务 部 门 的 相关 人 员 和 技术 人 员 。 针 对 不 同 的 调研 对 象 ， 调 研 的 侧重 点 也 
有 所 不 同 。 

6) 商业 智能 项 目的 需求 定义 包括 需求 调研 问 夫 设 计 ， 需 求 调 研 问 和合 内 容 ， 制 订 商 业 智 能 
项 目的 调研 计划 ， 调 研 的 内 容 和 形式 ， 商 业 智 能 项 目 珊 求 的 总 结 与 整理 ， 需 求 说 明 书 的 编写 ， 
XP SR) PT UCUT-P R5 o 

7) 系统 原型 的 建立 为 以 后 的 系统 开 肥 、 测 试 和 系统 实施 上 线 打 下 了 基础 。 

8) 验收 和 评审 的 内 容 包 括 会 议 式 、 传 阅 式 、 批 准 式 评审 。 
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第 9 章 商业 智能 项 目 模型 的 建立 


本 章 目标 

与 理论 篇 中 的 数据 模型 内 容 不 同 , 本 章 的 重点 是 根据 实际 项 目 介 绍 数 据 模 型 的 设计 原则 ， 
概念 模型 的 分 析 方 法 ， 主 题 域 的 设计 ， 主 题 的 设计 ， 针 对 ODS 的 渴 辑 模型 设计 、 物 理 设 计 ， 
针对 数据 仓库 的 逻辑 设计 、 物 理 设 计 ， 针 对 数据 集 市 的 逻辑 设计 、 物 理 设计 等 内 容 。 

FAKE, KKJ: 

e 数据 模型 的 设计 原则 。 

e 企业 数据 柑 型 转换 到 数据 仓库 模型 的 一 般 步 又 。 

e 概念 模型 的 设计 方法 。 

e 迄 辑 模型 的 设计 方法 。 

e 物理 模型 的 设计 方法 。 


9.1 数据 模型 的 设计 原则 


10 数据 模型 的 设计 应 该 满足 ODS、 数 据 仓 库 、 数 据 集 市 的 存储 要 求 。 

2) ODS 的 数据 模型 应 该 能 够 满足 业 务 系 统 的 集成 性 和 交互 性 ， 提 供 统 一 的 数据 视图 。 

3) 数据 仓库 模型 应 该 满足 企业 决策 分 析 的 禹 要 ， 和 存储 核心 的 历史 数据 ， 完 成 必要 的 汇总 
计算 等 要 求 。 

4) 数据 集 市 模型 应 该 满足 业务 分 析 需 求 ， 一 般 满 足 星 型 模型 或 者 雪 化 型 模型 等 大 系 便 式 。 

5) 数据 模型 的 设计 一 般 仁 循 国际 通用 的 标准 。 

6) 数据 模型 的 设计 和 需要 保证 业务 系统 的 扩展 性 。 



































9.2 企业 模型 的 意义 


9.2.1 企业 模型 的 定义 


企业 模型 是 根据 业务 系统 的 特点 ， 用 数据 建 模 的 方法 描述 企业 的 各 种 生产 经 营 活动 ， 是 
对 业务 系统 的 抽象 ， 是 企业 信息 化 建设 的 基础 。 


9.2.2 ”建设 企业 模型 的 意义 


企业 数据 檬 型 从 企业 的 角度 去 分 析 、 构 造 相 应 的 业务 数据 模型 。 建 议 企业 数据 模型 的 总 
义 如 图 9-1 所 示 。 

D 有 利于 实现 应 用 系统 与 业务 数据 的 分 离 ， 能 够 将 部 门 级 别 的 数据 汇总 到 企业 的 全 局 视 
图 中 ， 提 高 企业 的 信息 化 建设 。 

2) 为 企业 的 数据 仓库 建设 打 好 基础 ， 提 高 企业 的 决策 分 析 能 力 。 
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3) 有 利于 规范 各 种 业务 概念 ， 避 免 业务 概念 的 不 一 致 ， 从 而 降低 系统 应 用 集成 的 难度 。 

4) 增强 IT 技术 人 员 与 业务 人 员 的 沟通 ， 近 高 沟通 的 效率 。 

5) 企业 数据 模型 是 企业 高 层 领导 、 业 务 人 员 、IT 技术 人 员 共 孚 的 信息 平台 ， 是 企业 信 
县 化 应 用 建设 的 基础 。 
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图 9-1 建设 企业 数据 模型 的 意义 


9.2.3 ”企业 数据 模型 和 其 他 模型 之 间 的 关系 


企业 数据 模型 是 构建 数据 仓库 模型 、ODS 模型 、 数 据 集 市 模型 的 基础 ， 如 图 9-2 所 示 。 
企业 模型 的 设计 主要 与 业务 相关 ， 指 导 业 务 系统 其 他 模型 的 建设 ， 保 证 ODS 模型 、 数 据 仓库 
模型 和 数据 集 市 模型 与 企业 模型 的 一 致 性 。 数 据 仓库 模型 、ODS 模型 、 企 业 数 据 模 型 都 属于 
关系 型 数据 模型 ， 而 数据 集 市 属于 多 维 数据 模型 。 


数据 集 市 模型 数据 仓库 模型 


企业 数据 模型 

















图 9-2 企业 数据 模型 和 其 他 模型 之 间 的 关系 


9.2.4 ”与 企业 数据 模型 相关 的 概念 
(1) ODS 


ODS 是 各 个 业务 系统 之 间 共 侍 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 之 间 

的 缓冲 区 。ODS 按照 职能 可 以 划分 为 3 个 部 分 :数据 绥 冲 区 、 统 一 信息 视图 区 和 ODS 常理 

区 ， 如 图 9-3 所 示 。 数 据 绥 冲 区 为 统一 信息 视图 区 提供 临时 的 存储 区 ， 它 的 存储 方式 和 数据 

结构 通常 与 源 系 统 相同 。 统 一 信息 视图 区 为 企业 提供 统一 的 数据 视图 区 ， 并 且 按 照 主 题 进行 
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划分 , 存储 实时 的 业务 数据 , 方便 系统 得 询 当前 的 数据 。 其 中 ODS 管理 区 的 作用 是 对 ODS 23 











据 库 进 行 管理 ， 包 括 存 放 ETL 的 状态 信息 和 日 志 信 息 等 内 容 。 


统一 信息 视图 区 





图 9-3 ODS 的 划分 


(2) 数据 仓库 

数据 仓库 是 一 个 和 面 加 主题 的 、 集 成 的 、 不 易 丢 失 的 ， 并 且 随 时 间 变 化 的 帮助 企业 管理 人 
员 决 策 分 析 的 数据 集合 。 数 据 仓库 的 理论 知识 在 理论 篇 中 己 经 有 详细 的 介绍 ， 此 处 不 再 次 述 。 

(3) 数据 集 市 

数据 集 市 是 在 数据 仓库 的 基础 上 创建 起 来 的 ， 根 据 各 个 业务 部 门 的 不 同 需 要 ， 对 数据 仓 
库 中 的 数据 进行 高 度 汇总 、 计 算 。 数 据 集 市 的 作用 是 创建 一 组 特定 的 、 针 对 东 个 主题 域 或 者 
部 门 的 特殊 数据 集合 。 一 般 来 说 ， 数 据 集 市 的 模型 部 采用 星 型 模式 或 雪 化 型 模式 。 


9.2.5 ”企业 数据 模型 转换 到 数据 仓库 模型 的 步骤 


(1) 在 企业 模型 中 有 条 件 地 选择 数据 仓库 需要 的 数据 

站 完 数 据 仓库 模型 应 该 包含 数据 仓库 项 目 中 所 有 的 需要 , 在 企业 数据 模型 转换 a 到 数据 仓库 柑 
型 的 过 程 中 ， 应 该 有 目的 地 选择 一 些 数据 。 可 以 将 数据 元 素 分 成 需要 的 数据 元 素 、 不 需要 的 数据 
元 系 、 可 能 需要 的 数据 元 素 。 重 点 是 如 何 选择 可 能 需要 的 数据 元 素 ， 如 末 是 事务 性 的 数据 元 系 ， 
无 论 是 合 需 要 它 ， 都 应 该 引入 ; 但 是 其 他 类 型 的 数据 元 素 ， 如 果 不 确定 ， 则 更 倾向 于 删除 它 。 在 
图 9-4 中 ， 企 业 数 据 模型 实体 中 包 仿 职工、 学生、 用 户 、 课 程 等 实体 ， 如 果 针 对 数据 仓库 中 的 销 



























































售 主题 域 ， 可 以 选择 用 户 实体 ， 同 时 包含 了 有 间接 关系 的 用 户 信息 渠道 、 用 户 关 别 实体 。 


企业 数据 模型 的 实体 | 选择 相关 的 实体 间接 相关 的 实体 
HP 








Hi Ps ERE 
用 户 类 别 





图 9-4 有 条 件 地 选择 感 兴趣 的 实体 


(2). 为 企业 模型 的 每 个 实体 都 增加 时 间 键 
在 企业 数据 模型 中 ， 有 些 实体 可 能 会 含有 时 间 键 ， 有 坚实 体 可 能 不 含有 时 间 键 ; 但 是 在 
数据 仓库 模型 中 ， 所 有 的 实体 部 应 该 包含 时 间 键 (除了 统一 编码 实体 )， 因 为 数据 仓库 存储 的 
古 核心 的 历史 数据 ， 加 入 时 间 键 是 重要 的 搜集 历史 数据 的 方法 。 加 入 时 间 键 的 原则 是 : 如 来 
该 实体 已 经 存在 时 间 属 性 ， 分 析 该 时 间 属 性 是 个 满足 历史 信息 的 分 析 ， 如 条 可以， 则 使 用 该 
时 间 属 性 。 如 来 该 实体 没有 时 间 键 ， 同 时 它 叉 不 是 统一 编码 实体 〈 即 在 一 定时 间 内 不 会 修改 
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的 实体 )， 则 需要 加 入 时 间 键 ， 以 保证 该 实体 的 历史 信息 分 析 。 举 一个 简单 有 趣 的 例子 ， 一 个 
普通 的 卖国 大 兵 可 能 需要 以 下 信息 : 姓名 、 编 号 、 入 伍 时 间 、 凄 备 、 退 伍 时 间 ， 如 图 9-5 所 
示 。 因 为 入 伍 时 间 和 退伍 时 间 一 般 是 固定 的 ， 不 能 满足 对 该 实体 的 历史 信息 的 分 析 需 求 ， 兵 
以 增加 了 作战 时 间 这 个 属性 ,每 个 关 国 大 兵 的 作战 时 间 随 看 地 区 、 战 场 的 不 同 都 会 发 生变 化 ， 
不 断 产 生 新 的 历史 数据 ， 因 此 该 属性 满足 了 企业 数据 柑 型 转换 到 数据 仓库 模型 的 基本 条 件 。 


姓名 








姓名 编写 


编写 作战 时 间 


入 伍 时 间 入 伍 时 间 
装备 装备 
退伍 时 间 退伍 时 间 





图 9-5 ”为 企业 数据 模型 增加 时 间 键 


(3) 确定 数据 仓库 的 粒度 

确定 数据 仓库 的 粒度 级 别 影响 了 数据 仓库 模型 的 设计 ,因为 它 规定 了 数据 仓库 的 灵活 性 ， 
包括 数据 仓库 的 开销 和 创建 数据 仓库 的 工作 量 是 多 少 。 粒 度 级 别 越 高 ， 数 据 仓库 需要 处 理 的 
数据 量 越 多 。 虽 然 这 样 增加 了 系统 的 性 能 负担 ， 但 却 提高 了 数据 仓库 的 灵活 性 和 潜在 的 分 析 
能 力 。 如 果 粒 度 级 别 低 ， 则 降低 了 系统 的 性 能 负担 ， 但 却 降低 了 数据 仓库 的 灵活 性 和 分 析 能 
力 。 如 果 数 据 仓库 需要 高 细节 的 数据 ， 直 接 把 部 分 相关 实体 全 部 抽取 到 数据 仓库 中 ， 如 果 数 
据 仓 库 不 需要 高 细节 的 数据 ， 则 可 以 对 部 分 实体 进行 轻 度 汇 总 或 者 过 滤 。 

CA). 汇总 企业 模型 中 的 数据 

汇总 企业 模型 中 数据 的 目的 是 节省 数据 仓库 中 的 空间 ， 提 高 数据 仓库 的 性 能 。 

汇总 的 方法 有 多 种 ， 最 主要 的 有 : 对 实体 一 个 属性 上 的 数据 求 和 ， 汇 总 一 定时 间 段 内 的 
数据 ， 按 照 某 种 分 类 进行 汇总 数据 ， 或 者 汇总 固定 时 间 间 隔 内 的 数据 的 值 。 

汇总 企业 数据 模型 举例 如 网 9-6 所 示 。 


产 s Js 别 P= nn Ed 量 














图 9-6 汇总 企业 数据 模型 
(5) 根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 





合并 实体 是 为 了 将 两 个 或 者 多 个 实体 合并 成 一 个 实体 ， 通 过 合并 实体 可 以 减少 实体 之 
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间 的 连接 操作 ， 拓 局 数据 仓库 的 性 能 。 合 并 实体 的 条 件 是 多 个 实体 之 间 必 须要 有 共同 的 键 ， 
否则 不 能 合并 。 当 多 个 实体 合并 到 一 个 实体 中 时 ， 任 何 属性 的 变化 都 会 产生 新 的 一 行 。 合 
并 实体 是 将 第 三 范式 回归 到 第 二 范式 的 过 程 。 如 图 9-7 所 示 ， 美 国 大 兵 作为 一 个 实体 ， 有 
姓名 、 作 战 时 间 、 人 入 伍 时 间 、 退 伍 时 间 、 闭 备 编号 、 性 别 编号 等 属性 ， 同 时 关联 两 个 实体 
顷 码 表 《〈 净 备 编码 实体 、 性 列 编码 实体 )， 为 了 提高 数据 仓库 的 性 能 ， 增 加 数据 仓库 的 灵活 
性 ， 把 美国 大 兵 实 体 和 装备 编码 实体 、 性 别 编码 实体 进行 了 合并 ， 也 就 是 将 第 三 范式 回归 
到 第 二 范 却 。 
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图 9-7 合并 实体 
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总 结 ， 企业 数据 模型 转换 到 数据 仓库 模型 的 步骤 如 图 9-8 所 示 。 


ALS eH: 


在 企业 模型 中 选择 数据 仓库 需要 的 数据 


在 企业 模型 的 各 个 实体 中 增加 时 间 键 


| H > 
Y ya 
JUS 





确定 数据 仓库 的 粒度 


汇总 企业 模型 中 的 数据 


y 





根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 





图 9-8 企业 数据 模型 转换 到 数据 仓库 模型 的 步 又 


9.3 ”概念 模型 的 设计 


概念 模型 是 最 珊 层 次 的 数据 模型 ， 它 定义 了 核心 的 业务 概念 及 其 关系 。 概 念 模型 的 分 析 
以 企业 模型 为 基础 的 ， 而 企业 醒 型 主要 描述 企业 内 部 的 组 织 结构 和 企业 经 营 活动 状况 











XB e 
等 信息 。 概 念 模型 主要 包含 主题 域 和 主题 域 下 面 的 主题 。 主 题 域 反映 了 茶 方 面 的 业务 活动 情 


9] 


况 ， 并 且 按 照 企业 经 莒 活动 的 规律 将 实体 和 实体 乙 间 的 关系 进行 划分 。 主 题 域 用 以 描述 企业 
核心 的 业务 数据 ， 它 独立 于 任何 业务 系统 ， 描 述 了 企业 经 萌生 产 活动 中 ， 需 要 管理 的 主题 的 
集合 。 主 题 域 可 以 进一步 划分 成 各 个 主题 ， 概 念 模型 的 主题 是 通过 分 析 企业 包 售 的 经 营 活动 、 
业务 流程 、 业 务 之 间 的 关联 关系 和 所 涉及 的 数据 概念 得 出 的 。 主 题 也 可 以 进一步 细 化 成 更 小 
的 主题 ， 实 体 是 概念 模型 建设 中 最 小 的 单元 ， 是 不 可 划分 的 。 概 念 模型 就 是 由 主题 域 、 主 题 、 
实体 和 实体 之 间 的 关系 组 成 的 。 概 念 模型 的 组 成 如 图 9-9 所 示 。 


























实体 和 实 


体 之 间 的 
关系 





图 9-9 概念 模型 的 组 成 


举例 如 下 : 人 员 基 本 信息 主题 域 用 于 摘 述 人 员 的 基本 信息 情况 。 人 员 基 本 信息 主题 域 包 
售 人 员 家 庭 成 员 信 息 、 人 员 职 位 信息 、 人 员工 作 经 历 信 息 、 人 员 桩 会 天 系 信息 、 人 员 教 育 育 
景 信息 、 人 员 通 信 地 址 信息 、 人 员 社 会 保险 信息 等 主题 ， 如 图 9-10 所 示 。 
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经 历 信息 背景 信息 











图 9-10 人 员 基 本 信息 主题 域 
9.4 ”逻辑 模型 的 设计 
9.4.4 ODS 逻辑 模型 


1. ODS 逻辑 模型 设计 
ODS 逻辑 模型 设计 通过 ODS 统一 信息 视图 区 集成 各 类 业务 系统 的 源 数 据 ， 以 数据 主题 域 作 
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为 设计 的 基础 。ODS 统一 信息 视图 区 有 选择 性 的 集成 各 类 业务 系统 的 数据 ， 通 过 ETL 数据 抽取 、 
转换 、 加 载 与 业务 系统 进行 诡 互 ， 它 主要 保存 与 主题 相关 的 、 实 时 性 的 信息 ， 因 此 ODS 统一 信 
县 视图 区 具有 准 实 时 性 的 特点 ;而 业务 系统 的 数据 通过 一 定 的 时 间 间 隔 ， 最 终 以 主题 的 形式 反映 
到 ODS 统一 信息 视图 区 中 。 如 图 9-11 所 示 ， 用 户 可 以 访问 ODS 统一 信息 视图 区 ， 以 便 快 速 查 
询 某 个 主题 的 信息 。 














人 员 基 本 信息 主题 域 (ODS 统 一 信息 视图 区 ) 


人 员 家 庭 成 员 信息 | ”人员 职位 信息 ”| 人 员工 作 经 历 信 息 


人 员 社 会 关系 信息 人 员 社 会 保险 信息 





图 9-11 业务 系统 与 ODS 统一 信息 视图 区 的 交互 


通过 业务 系统 的 不 断 完善 和 加 蝇 ，ODS 他 男模 型 不 断 得 到 人 补充。 企业 从 外 部 或 者 内 部 生 
广 经 营 活 动 中 获得 各 种 业务 数据 ， 按 照 业 务 功 能 分 成 几 类 主题 域 ,， 由 ODS 统一 信息 视图 区 插 
述 各 个 主题 域 。 如 图 9-12 所 示 ， 关 国 国防 部 整体 可 以 划分 成 人 员 与 组 织 主 题 域 、 科 技 研 帮主 
题 域 、 国 防 财 政 主题 域 、 反 恐 主 题 域 、 安 全 主题 域 、 作 战 计 划 主 题 域 、 能 源 主题 域 、 通 信 主 
题 域 、 人 力 资 源 主 题 域 。 

















图 9-12 美国 国防 部 划分 的 主题 域 

ODS 统一 信息 视图 区 的 逻辑 模型 可 以 用 绿色 表示 中 间 库 编 色 ， 橙 色 表 示 目 己 的 私有 纺 公 ， 
黄色 表示 统一 编 色 。 美 国 大 兵 实 体 关 联 各 个 编码 实体 ， 包 括 疙 备 类 型 编码 实体 、 通 信 地 址 编码 
实体 、 宗 衔 等 级 编码 实体 、 作 战地 区 编码 实体 。 其 中 疙 备 类 型 编码 实体 和 作战 地 区 编码 实体 作 
为 逻辑 模型 中 的 中 间 库 编码 ， 通 信 地 址 编码 实体 作为 私有 编 公 ， 人 军衔 等 级 编 公 实 体 作为 整个 主 
古 域 的 统一 编码 ,它们 部 隶属 于 人 员 与 组 织 主题 域 该 主题 域 下 的 各 个 编码 实体 如 图 9-13 所 示 。 

2. ODS 逻辑 模型 的 设计 步 又 

ODS 滥 辑 模型 设计 主要 考 夸 业务 乙 间 的 关系 和 业务 处 理 的 流程 。 处 理 的 步骤 如 下 : 

(1) 确定 业务 系统 数据 的 范围 

在 ODS 滥 辑 模型 设计 中 ， 确 定 业务 系统 数据 范围 是 在 调研 的 基础 上 进行 的 ， 然 后 再 进行 
主题 的 划分 ， 以 确 你 主题 需要 的 数据 部 能 从 业务 系统 中 获得 。 远 辑 模 型 设计 过 程 中 需要 对 各 
种 业务 模型 进行 合并 或 者 拆 分 ， 然 后 再 进行 抽象 ， 以 便 划 分 ODS 数据 主题 的 范围 。 
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装备 类 型 编码 


- r4 3 


军衔 等 级 编码 作战 地 区 编码 


图 9-13 ”人员 与 组 织 主题 域 的 编码 实体 












(20 对 主题 的 定义 

根据 调研 的 结 末 和 业务 系统 数据 的 范围 ， 对 较 大 的 数据 主题 进行 分 解 、 定 义 ， 以 便 形成 
各 个 主题 。 

(3) 确定 主题 的 元 素 

根据 每 个 主题 ， 分 别 定义 实体 、 实 体 之 间 的 关系 ， 每 个 实体 的 属性 和 存储 粒度 每 。 

(4) 合并 相同 的 实体 及 其 属性 

对 每 个 主题 中 相似 的 实体 及 其 属性 进行 合并 ， 保 证 各 实体 的 一 致 性 和 唯一 性 。 


ODS 逻辑 模型 的 设计 步骤 如 图 9-14 所 示 。 












逻辑 模型 的 对 主题 的 
设计 步骤 定 》 





图 9-14 ODS 逻辑 模型 的 设计 步 又 


3. ODS 的 存储 周期 和 存储 粒度 

ODS 的 存储 周期 分 为 以 下 儿 种 情况 : 

1) 当 临 时 数据 从 ODS 存储 区 加 载 到 数据 仓库 后 ， 需 要 删除 ODS 存储 区 中 的 临时 数据 。 

2) 对 于 细节 性 或 者 汇总 的 数据 ， 可 以 按照 实际 的 业务 需求 ， 以 年 、 季 、 月 进行 存储 ， 并 
且 删 除 过 期 数据 。 

3) ODS 存储 区 中 如 来 存在 一 些 有 价值 的 数据 ， 但 是 使 用 频率 较 低 ， 则 需要 将 数据 备份 
到 其 他 存储 介质 中 ， 为 以 后 使 用 作 准 备 。 

总 结 : 存储 粒度 的 划分 将 直接 影响 ODS 远 辑 模型 的 设计 和 ODS 存储 区 的 数据 量 ，ODS 
的 存储 粒度 一 般 与 源 数 据 保 持 一 致 。 
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4. ODS 逻辑 异型 实例 


如 图 9-15 所 示 ， 国 家 、 省 、 地 市 、 县 、 区 等 实体 继承 地 区 实体 。 


“地 区 范围 类 型 


编码 «Undefined» 
名称 《Undefinedy> 


ielationship 11 


地 区 


| 
编码 《Undefined> 
EE «Undefined»? 
| 





Inheritance 2 


| 国家 


编码 《Undefined> 
名 称 <Undefined> 


区 


| 编码 «Undefined? 
| 名称 XUndefined» 








省 | p 地 市 


编码 «Undefined? 
和 名称 《Undefined> 


编码 «Undefined» 
和 名称 《Undefined>》 





县 


| 编码 《Undefined> | 
和 名称 XUndefined» 











图 9-15 ODS 逻辑 建 模 实例 
模型 描述 见 表 9-1 一 表 9-7。 
表 9-1 国家 
中 文 属性 名 英文 属性 名 数据 类 型 
表 9-2 省 
中 文 属性 名 英文 属性 名 数据 类 型 
表 9-3 地 市 
中 文 属性 名 英文 属性 名 数据 类 型 
表 9-4 县 
E 中 文 属性 名 英文 属性 名 数据 类 型 





Hi 


Hi 


Hi 


Hi 


X 9-5 区 


序 号 中 文 属性 名 英文 属性 名 数据 类 型 TE 
5 


表 9-6 地 区 


序 中 文 属性 名 英文 属性 名 数据 类 型 TE 


表 9-7 地 区 范围 类 型 


序 中 文 属性 名 英文 属性 名 数据 类 型 TE 


9.4.2 ”数据 仓库 逻辑 模型 


1. 数据 仓库 逻辑 模型 设计 

数据 仓库 馆 辑 模型 羡 对 概念 模型 的 进一步 细 化 和 分 解 ， 主 要 描述 了 实体 、 属 性 以 及 实体 
之 间 的 关系 。 数 所 仓库 锡 辑 模型 设计 的 主要 工作 《〈 见 图 9-16) A: 

D 以 概念 模型 为 基础 ， 进 一 步 分 解 、 细 化 当前 的 主题 域 。 

2) 定义 合适 的 数据 来 源 。 

3) 确定 数据 仓库 存储 的 粒度 。 

4) 确定 数据 仓库 模型 中 的 实体 、 属 性 以 及 实体 之 间 的 关系 。 

















以 概念 模型 为 基础 ， 进 一 步 分 解 、 细 化 当前 的 主题 域 


定义 合适 的 数据 来 源 


确定 数据 仓库 存储 的 粒度 


确定 数据 仓库 模型 中 的 实体 、 属 性 以 及 实体 之 间 的 关系 





图 9-16 ”数据 仓库 逻辑 模型 设计 的 主要 工作 


2. 确定 数据 仓库 的 存储 粒度 

数据 仓库 逻辑 设计 主要 解决 数据 仓库 的 粒度 划分 问题 。 粒 度 层 次 的 划分 下 接 决 定 了 数据 
仓库 中 的 数据 量 和 僵 询 方式 。 要 选择 一 个 合适 的 粒度 级 ， 除 了 业务 上 的 需求 ， 更 需要 项 目 经 
验 的 积累 。 在 细 市 程度 很 蜗 的 数据 上 建立 轻 度 六 忌 会 浪费 数据 库 资源 ， 降 低 俘 询 的 灵活 性 ， 
但 是 会 减少 数据 仓库 中 的 数据 量 ， 提 高 数据 仓库 运行 的 效率 。 而 如 何 确定 数据 仓库 的 存储 粒 
度 ， 需 要 得 到 用 户 的 认可 。 
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3. 确定 数据 仓库 的 存储 

数据 仓库 的 存储 一 般 是 稳定 的 ， 不 易 变 化 的 。 对 于 查询 频率 高 的 业务 数据 ， 需 要 将 数据 
存放 到 数据 仓库 中 ;对 于 一 些 在 询 频率 低 的 ， 并 且 已 经 超出 了 存储 期 限 的 业务 数据 ， 应 该 分 
离 到 外 部 存储 介质 上 ， 以 备 将 来 查询 使 用 。 

4. 数据 仓库 的 建 模 方法 

数据 仓库 一 般 的 建 模 方法 是 通过 调研 的 结果 和 业务 系统 详细 说 明文 档 ， 经 过 分 析 、 梳 理 列 出 
所 有 可 能 的 数据 主题 。 根据 分 析 得 出 的 数据 主题 , 结合 相关 业务 的 关注 点 可 以 划分 出 各 个 主题 域 。 
主题 域 通常 是 联系 较为 紧密 的 数据 主题 的 集合 。 例 如 ， 从 调研 中 获悉 该 业务 包含 以 下 数据 主题 : 
客户 基本 人 信息、 客户 信用 信息 、 客 户 资 产 信 息 、 上 毕业 学 校 信息 、 出 生日 期 、 地 址 信息 、 岗 位 信息 、 
联系 方式 信息 、 婚 姻 状 况 信 息 。 可 以 根据 业务 的 关注 点 ， 将 这 些 数 据 主题 划分 成 员工 信息 主题 域 
和 客户 主题 域 。 其 中 ， 员 工 信 息 主题 域 包含 毕业 学 校 信 息 、 出 生日 期 、 地 址 信息 、 疯 位 信息 、 联 
系 方式 信息 、 婚 姻 状 况 信 息 ; 客户 主题 域 包含 客户 基本 信息、 客户 信用 信息 、 客 户 资 产 信息 。 

员工 信息 主题 域 和 客户 主题 域 如 图 9-17 所 示 。 

员工 为 客户 提供 服务 


FN 


员工 信息 主题 域 客户 主题 域 































































































. 毕业 学 校 信息 * 客户 基本 信息 
* 出 生日 期 s 客 书信 用 信息 
* 地 址 信息 * 客户 资产 信息 


* 辐 位 信息 
e 联系 万 式 信息 
。 婚姻 状况 信息 








图 9-17 员工 信息 主题 域 和 客户 主题 域 
5. 数据 仓库 主题 域 设计 
主题 域 设计 是 数据 仓库 逻辑 模型 建设 中 重要 的 一 步 ， 因 为 它 反映 了 企业 主要 的 业务 活动 
和 内 容 ， 根 据 企业 活动 的 特点 和 业务 之 间 的 关联 关系 进行 主题 域 的 划分 。 主 题 域 描述 了 企业 
活动 的 核心 内 容 , 如 图 9-18 所 示 ,北大 西洋 公约 组 织 (北约 ) 的 主题 域 设计 包含 了 北约 的 宗旨 、 
会 议 、 组 织 机 构 、 战 略 、 主 要 事件 等 主题 域 。 


























图 9-18 主题 域 
c. 数据 仓库 主题 设计 
主题 设计 是 对 主题 域 进一步 分 解 、 细 化 的 过 程 。 主 题 域 下 面 可 以 有 多 个 主题 ， 主 题 还 可 
以 划分 成 更 多 的 主题 ,而 实体 则 是 不 可 划分 的 最 小 单位 。 主题 域 、 主 题 、 实 体 的 关系 如 图 9-19 
所 示 。 
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图 9-19 ”主题 域 、 主 题 、 实 体 的 关系 





主题 设计 的 原则 如 下 : 

1) 主题 设计 的 命名 方式 与 主题 域 的 命名 方式 剑 持 一 致 。 

2) 对 主题 进行 不 断 的 细 化 、 分 解 ， 直 到 明确 模型 中 的 业务 概念 为 止 。 

3) 当主 题 细 化 、 分 解 的 工作 完成 之 后 ， 需 要 对 主题 或 者 实体 之 间 的 天 系 进 行 建 醒 ， 从 而 
理解 相关 的 业务 规则 。 

例如 , 针对 北大 西洋 公约 组 织 (北约 ) 主 题 域 中 的 组 织 机 构 进 行 主题 设计 , 如 图 9-20 所 示 。 














理事 会 计划 委员 会 际 秘书 册 
北大 西洋 议会 军事 委 员 会 


图 9-20 组 织 机 构 主题 域 


7. 数据 仓库 逻辑 模型 设计 
针对 会 议 主题 域 的 馆 辑 模型 设计 如 图 9721 Bran 





军事 委员 会 





3elationship 1aelationship 13 ielationship 14 























国际 军事 参谋 部 | | ”战区 司令 部 | 负责 北约 防务 
relationship 1 xelationship 16 
i- 
实施 军委 会 的 政策 和 计划 | | ”各 战区 编码 














图 9-21 会 议 主题 域 的 逻辑 模型 设计 
模型 描述 如 下 : 
D 军事 委员 会 : 北约 军事 、 政 治 的 决策 机 构 ， 同 时 向 北约 秘书 长 、 北 大 西洋 理事 会 、 防 
务 计划 委员 会 等 提供 建议 ， 是 北约 的 最 高 军事 机 构 。 
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2) 国际 军事 参谋 部 :是 北约 军事 委员 会 的 执行 机 构 ， 负 责 制 订 军 事 计 划 、 提 出 有 关 军 事 
政策 的 建议 ， 负 责 执行 北约 军事 委员 会 的 各 种 决定 。 

3) 战区 司令 部 : 北约 军事 委员 会 下 辖 的 战区 司令 部 。 

4) 负责 北约 防务 : 由 北约 军事 委员 会 负责 领导 北约 防务 的 问题 。 

5) 实施 军委 会 的 政策 和 计划 : 由 国际 军事 参谋 部 负责 实施 军委 会 的 政策 和 计划 。 

6) 各 战区 编码 : 包括 目前 北约 所 有 的 战区 名 称 及 其 战区 编码 。 

逻辑 模型 中 的 实体 可 以 分 成 两 个 部 分 : 普通 实体 和 从 其 他 主题 中 引用 的 实体 。 在 图 9-21 
中 ， 军 事 委 员 会 是 从 其 他 主题 中 引进 的 ， 所 以 可 以 将 它 标 成 黄色 以 示 区 分 。 

其 他 的 实体 ， 例 如 国际 军事 参谋 部 、 战 区 司令 部 等 都 是 模型 中 普通 的 实体 ， 以 绿色 表示 ， 
实体 和 实体 之 间 的 关系 也 可 以 分 成 普通 的 对 应 关系 和 汇总 关系 。 

8. 数据 仓库 逻辑 模型 建设 方案 

数据 仓库 他 辑 模 型 建设 方案 如 图 9-22 所 示 。 

d) 通过 轻 度 汇总 或 者 高 度 汇 总 的 方式 架构 数据 仓库 逻辑 模型 

通过 轻 度 汇总 或 者 高 度 汇总 的 方式 架构 逻辑 模型 ， 针 对 整个 数据 仓库 项 目 ， 标 准 化 地 管 
理 层次 编码 ， 根 据 不 同 的 类 型 编码 〈 例 如 地 区 编码 、 人 员 类 型 编码 ) 多 角度 地 实现 数据 的 汇 
总 和 标准 化 ， 明 确 各 项 汇总 数据 在 数据 仓库 中 的 粒度 。 虽 然 这 种 建 模 方 式 相 对 容易 实现 ， 但 
是 存在 一 定 的 缺陷 ， 丈 是 对 各 种 特殊 的 、 灵 活 多 变 的 查询 所 需求 的 文 持 性 较 差 ， 上 只 适合 一 般 
相对 稳定 的 查询 需求 。 

(2) 通过 提供 相对 细 市 的 数据 染 构 数据 仓库 逻辑 模型 

针对 特殊 的 、 灵 活 的 查询 需求 ， 可 以 提供 粒度 级 别 相 对 较 细节 的 数据 作为 数据 仓库 逻辑 
建 模 的 基础 ， 这 样 可 以 满足 更 长 远 的 需求 。 但 是 这 种 建 模 方 式 相 对 难度 较 大 ， 开 发 周期 较 长 ， 
需要 技术 开发 人 员 与 设计 人 员 理 解 的 业务 规则 更 多 。 

总 结 : 在 设计 数据 仓库 逻辑 建 模 方 案 的 时 候 ， 通 常 采 用 两 种 方式 相 结 合 的 方法 。 针 对 灵 
活 多 变 的 得 询 分 析 需 求 ， 尽 量 将 数据 的 粒度 级 别 更 细 和 化， 对 于 相对 稳定 的 查询 需求 ， 更 倾 
器 于 通过 对 数据 的 轻 度 汇总 或 者 高 度 汇 总 去 架构 数据 仓库 逻辑 模型 。 

























































































































。 适 合 一 般 相对 稳定 的 查询 需求 
通过 轻 度 汇总 或 者 高 度 |。 这 种 建 模 方式 相对 容易 实现 
汇总 的 方式 架构 数据 

仓库 逻辑 模型 









。 针 对 特殊 的 、 灵 活 的 查询 需求 ， 
通过 提供 相对 细节 的 | 满足 更 长 远 的 需求 
数据 架构 数据 。 这 种 建 模 方式 相对 难度 较 大 ， 开 
仓库 逻辑 模型 发 周期 较 长 ， 需 要 技术 开发 人 员 
与 设计 人 员 理 解 的 业务 规则 更 多 


















图 9-22 ”数据 仓库 逻辑 模型 建设 方案 


9. 数据 仓库 逻辑 模型 实例 
图 9-23 押 示 的 数据 仓库 旬 辑 异型 包 售 洛 户 信息 实体 、 洲 在 客户 信息 实体 、 信 用 卡 客户 评 
价 关 型 实体 、 对 信用 卡 客户 的 评价 实体 、 信 用 卡 客户 基本 信息 实体 、 信 用 卡 客户 基本 信息 汇 
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MSk HPEH RAPERE AKAA SP. EARR MNE AAE SR. 
AEE AARE D RAES E A E 4H) AS AAE As 88 T ORUE S K 
体 的 历史 信息 分 析 ， 办 卡 数量 是 该 实体 需要 分 析 的 指标 项 Le 
信用 卡 客户 所 有 的 评价 闫 型 编码 和 和 名称。 该 模型 满足 第 三 范式 ， 信用 卡 客户 基本 信息 护 总 。 
体 是 根据 信用 卡 客户 基本 信息 实体 里 面 的 立户 时 间 、 销 户 时 间 ， 按 照 年 月 进行 汇总 ， 计 算出 
客户 的 数量 。 同 时 信用 卡 客户 基本 信息 实体 继 藉 了 客户 信息 的 基本 属性 。 












































信用 卡 客户 评价 类 型 








EN EE 


Rel DD 


Inheritance 1 





T - — 对 信用 卡 客户 的 评价 
信用 卡 客 广 基本 信息 汇总 | 开始 有 效 时 间 《Undefined> | 
年 月 《Undefined> 终止 有 效 时 间 «Undefined» 
客户 数量 <Undefined> | 客户 评价 编码 <Undefined> | 








telationship. 1 ielationship 2 











i 信用 卡 客户 基本 信息 
客户 编码 «Undefined? | 
i ie Undcfinros 
= | H Undefi d 
Beer iE 个 人 信息 更 改 时 间 «Undefined? 
销 户 时 间 <Undefined> 
办 卡 数 量 «Undefined» | 





图 9-23 Jd GE IRA 
模型 描述 见 表 9-8 一 表 9-13. 


表 9-8 客户 信息 


中 文 属 性 名 X X JV TE 数据 类 型 是 否 主 键 AE 
y 


Hi 


Y 


qtu 


Hi 


Y 


qt 


中 文 属性 名 英文 属性 数据 类 型 n 
| 


9-10 ”信用卡 客户 评价 类 型 
中 文 属性 名 英文 属性 名 数据 类 型 是 否 主 键 JF 





Hi 


Y 


qtu 





表 9-11 对 信用 卡 客户 的 评价 


| s 
有 : 
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序 号 中 文 属性 名 英文 属性 名 数据 类 型 Jp om 
i s 
N 
表 9-13 ”信用卡 客户 基本 信息 


序 “号 中 文 属性 名 英文 属性 名 数 据 类 型 非 
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Hi 


qt 








Hi 





| Y 
N 
1 N 
inm N 
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9.4.3 ”数据 集 市 逻辑 模型 


1， 数 据 集 市 逻辑 模型 的 设计 

数据 集 市 是 针对 特定 的 某 个 主题 域 ， 或 者 按照 部 门 进行 划分 的 数据 集合 。 这 些 数据 是 经 
过 ETL 工具 的 抽取 、 转 换 、 加 载 及 其 一 系列 的 汇总 计算 转化 而 成 的 ， 是 在 数据 仓库 的 基础 上 
建立 起 来 的 。 数 据 集 市 在 整体 结构 上 ， 应 该 符合 立方 体 的 规则 和 即席 查询 的 要 求 。 通 过 ETL 
工具 为 数据 仓库 生成 满足 条 件 的 立方 体 数据 ， 立 方 体 则 是 多 维 报表 查询 和 商业 智能 展现 分 析 
的 数据 提供 者 。 

数据 集 市 逻辑 模型 设计 的 主要 工作 ( 见 图 9-24) 包括 以 下 方面 。 






































确定 需要 分 
析 和 装载 的 
主题 


















确定 数据 集 
O)| 市 逻辑 模型 
的 粒度 


确定 数据 集 数据 集 市 逻辑 
模型 设计 的 
主要 工作 


市 的 存储 周期 









析 的 指标 和 
该 指标 需要 
的 维度 


图 9-24 ”数据 集 市 逻辑 模型 设计 的 主要 工作 
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(1) 确定 需要 分 析 和 小 载 的 主题 

需要 明确 哪些 主题 域 是 目前 决策 分 析 人 员 和 上 层 领 导 关 心 的 ， 访 主题 域 中 哪些 主题 是 商 
业 知 能 展现 的 基础 。 这 些 信 息 都 是 通过 调研 的 方式 得 出 的 结 末 。 

(2) 确定 数据 集 市 逻辑 模型 的 粒度 

通过 知 求 的 分 析 和 调研 的 结果 ， 确 定 模 型 中 所 有 实体 的 粒度 层次 。 例 如 ， 确 定 实 体 属性 
中 的 时 间 是 精确 到 月 ， 还 是 日 。 

(3) 确定 数据 集 市 逻辑 异型 需要 分 析 的 指标 和 该 指标 需要 的 维度 

数据 集 市 的 每 个 主题 都 是 由 多 张 表 组 成 的 。 这 些 表 由 事实 表 和 一 组 维 表 组 成 ， 需 要 确定 
数据 集 市 馆 辑 模型 由 哪些 事实 硼 和 维 表 组 成 ， 事 实 表 与 哪些 维 表 进行 关联 ， 每 个 事实 表 需 要 
分 析 哪 些 指 标 。 通 第， 这 些 指标 都 是 数值 其 型 的 或 者 是 可 以 进行 计算 的 。 这 些 指标 关联 的 维 
度 通 常 是 时 间 、 地 区 、 类 型 等 数据 。 

(4) 确定 数据 集 市 的 存储 周期 

一 般 来 说 ， 数 据 集 市 的 数据 相对 稳定 ， 其 存储 周期 也 相对 较 长 。 业 务 会 询 比较 频 粽 的 数 
据 需 要 长 期 存放 到 数据 集 市 中 ， 如 果 东 些 业务 数据 的 使 用 频率 较 低 ， 且 超过 了 存储 周期 ， 则 
存储 到 外 部 介质 上 ， 供 将 来 使 用 。 

2. 数据 集 市 逻辑 模型 的 设计 过 程 

数据 集 市 多 辑 模型 的 设计 过 程 是 通过 调研 的 结 采 和 对 业务 规则 的 了 解 ， 逐 步 划分 主题 域 
的 过 程 。 通 过 对 实体 和 实体 关系 的 定义 摘 述 业务 之 间 的 关系， 同时 拆 分 主题 ， 划 分 成 不 同 的 
指标 和 维度 ， 最 后 形成 事实 表 和 维 表 。 在 需求 的 分 析 过 程 中 ， 需 要 确定 数据 集 市 馆 辑 模型 的 
设计 范围 、 分 析 的 主题 ， 更 要 明确 数据 集 市 过 辑 模 型 的 数据 粒度 和 汇总 的 程度 。 

3. 数据 集 市 逻辑 模型 的 实例 

如 图 9-25 Biz, 客户 实体 作为 数据 集 市 的 事实 表 , 客 己 编码、 地 址 编码 、 行 业 类 型 编码 、 
客户 信用 编码 、 时 间 顷 码 作 为 维 表 。 它 们 应 该 隶属 于 客户 主题 。 客 户 事实 表 通 过 关联 5 张 维 
表 ， 可 以 从 客户 等 级 、 不 同 地 址 、 不 同行 业 、 客 户 的 信用 、 不 同 的 时 间 《〈《 和 年、 月、 日 ) 等 多 
角度 去 分 析 客 户 购 买 商 品 的 数量 ， 实 现 了 从 多 角度 奋 询 数据 的 功能 。 










































































客户 等 级 编码 | 地 址 编码 


Relationship 18 Relationship 17 


客户 NEL I 


slationship 1 


Relationship. 21 ship 2C 


行业 类 型 编码 N d PS RE S 


图 9-25 ”数据 集 市 逻辑 模型 的 实例 
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模型 描述 见 表 9-14—3& 9-19. 


表 9-14 时 间 编 码 


序 号 中 文 属性 名 英文 属性 名 数据 类 型 J 
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序 


序 


序 
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[ow | 0» [ow-91 - 
[o8 oom [om | 
[o oom owe | 
| | 
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表 9-15 客户 信用 编码 


中 文 属性 名 英文 属性 名 数据 类 型 


qt 


: 


表 9-16 行业 类 型 编码 


qtu 





中 文 属性 名 英文 属性 名 数据 类 型 


表 9-17 地址 编码 
中 文 属性 名 英文 属性 名 数据 类 型 


表 9-18 客户 等 级 编码 


中 文 属性 名 英文 属性 名 数据 类 型 


qt 





qtu 





X 9-19 客户 
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9.5 物理 模型 的 设计 


9.5.1 ODS 物理 模型 的 设计 


1. ODS 物理 模型 的 设计 原则 

1) ODS 用 户 应 该 至 少 有 两 个 不 同 的 表 空 间 : 一 个 用 于 存放 数据 另 一 个 用 于 存放 索引 
数据 。 

2) ODS 用 户 如 果 存 在 大 数据 量 的 表 ， 可 以 考虑 为 该 表 建 立 分 区 以 改善 性 能 。 建 立 分 区 
有 哈 希 分 区 、 按 时 间 范 围 进 行 分 区 等 方法 。 

3) ODS 用 户 中 如 果 存 在 需要 经 常 查 询 的 字段 ， 应 该 考虑 是 合 可 以 建立 索引 ， 同 时 应 该 
周期 性 地 重建 索引 。 

4) 对 于 一 些 大 表 ， 应 该 定期 搜集 统计 信息 给 Oracle 优化 器 ， 以 提高 系统 的 性 能 。 

2. ODS 物理 模型 的 作用 

1) 能够 从 各 个 系统 抽取 企业 的 业务 数据 ， 通 过 ETL 完成 数据 的 整合 ， 为 企业 提供 全 局 
统一 的 数据 视图 。 

2) 为 企业 提供 数据 共享 的 功能 ， 消 除数 据 不 一 致 的 可 能 。 

3. ODS 物理 模型 的 实例 

用 户 基 本 信息 物理 表 主 要 存储 用 户 编 号 、 用 户 名 称 、 地 址 、 行 业 类 别 、 联 系 方式 等 字段 ， 
地 区 编码 物理 表 主 要 存储 地 区 编码 、 地 区 名 称 字 段 ， 如 图 9-26 所 示 。 其 中 用 户 基 本 信息 物理 
表 中 的 用 户 编 号、 用 户 名 称 、 联 系 方式 都 是 从 源 系 统 中 和 直接 抽取 ， 地 址 、 行 业 类 别 根据 编码 
表 转 换 得 到 。 
















































































用 户 基 本 信息 
用 户 编号 har2 (400) 
ich. 用 户 名 称 varchar2(400) 
地 区 编码 varchar2(20) 地 址 varchar2 (400 
地 区 名 称 varchar2(200) 行业 类 别 varchar2 (400 
联系 方式 varchar2(400 














图 9-26 ODS 物理 模型 实例 


部 分 地 区 的 编码 表 及 用 户 基 本 信息 见 表 9-20 和 表 9-21. 





表 9-20 部 分 地 区 的 编码 表 


地 区 编码 名 Hy 
00001 朝阳 区 
00002 海淀 区 
00003 STE 
00004 顺义 区 
00005 房山 区 
00006 西城 区 
00007 东城 区 
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表 9-21 Hp fs 


CENET TEE ETR 
UL Wi RH 
ER VRAE RAN 


Hub | aaco | vaea OONO | RMOAMERPHEER 
FADEN O msye | O Vedanp OONO O 根 所 行 W 关 刚 代 名表 转 
BIRO | —— Comme | — wena) — | — N ”| — A 
上 总结 : ODS WARE Mii Xtra. Y ERN SD AEST PEE: ETE 

计 。 该 物理 模型 不 仅 整 合 了 ETL 数据 抽取 的 基础 业务 数据 ， 同 时 也 是 业务 系统 数据 的 一 个 规 

i&. ODS 数据 库 中 一 般 存 储 的 都 是 实时 性 的 数据 ， 同 时 设计 人 员 需 要 考虑 数据 库 的 环境 ， 包 

插 数 据 量 、 数 据 的 访问 频率 以 及 如 何 优 化 数据 的 存储 、 访 问 效 这 等 内 容 。 


9.5.2 ”数据 仓库 物理 模型 的 设计 


1. 数据 仓库 物理 模型 设计 原则 

1) 数据 仓库 物理 模型 设计 以 逻辑 模型 为 基础 ， 不 仅 需 要 考 上 处 数据 仓库 的 数据 存储 问题 ， 
还 需要 考虑 数据 仓库 的 关系 模式 、 资 源 的 合理 应 用 等 情况 。 物 理 模 型 的 设计 是 数据 仓库 实施 
的 基础 染 构 。 

2) 数据 仓库 需要 考虑 细 市 数据 、 沪 总 型 的 数据 。 除 了 设计 符合 要 求 的 数据 存储 结构 外 ， 从 性 
能 的 角度 来 说 , 物理 模型 的 设计 也 尽量 减少 表 之 则 的 关联 ， 并 日 将 表 和 索引 存放 到 不同 的 表 空间 中 。 

3) 数据 仓库 物理 模型 除了 满足 现 有 的 业务 框架 外 ， 还 应 该 苦 碟 未 来 的 业务 扩展 等 需求 。 

2. 数据 仓库 物理 模型 的 作用 

1) 数据 仓库 物理 模型 文 持 企业 的 决策 分 机 ， 并 且 能 够 根据 业务 的 需求 对 不 同 的 得 询 频 率 
采取 不 同 的 设计 方法 。 

2) 数据 仓库 存储 了 大 量 的 历史 数据 ， 这 些 历史 数据 能 够 根据 物理 模型 组 织 成 统一 的 存储 
模型 ， 包 括 对 数据 的 汇总 、 转 换 和 计算 ， 以 支持 企业 的 决策 分 析 。 

3) 数据 仓库 物理 模型 是 数据 仓库 馆 辑 模型 在 数据 库 系 统 中 的 实现 方式 。 

4) 数据 仓库 物理 模型 为 企业 各 级 业务 人 员 、 分 析 人 员 所 供 统 一 的 数据 视图 。 

3. 数据 仓库 物理 模型 的 实例 

数据 仓库 物理 模型 的 实例 如 图 9-27 所 示 。 
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| 地 区 | 审 户 历史 信息 | 
EAD varcharZ(20) pk» 客户 篇 号 varchar2(20) fk? 
varchar? {400} 
Å 
EE_ 客 户 历 中 信息 REFEREKCE 3 P 
Y 
客户 


X XP REFERENCE.: = varchar2(20) «pk? | 
A. EUIS va ar2(20) €fk1» 


行业 类 型 编码 Tr aio) €fk2» 
购买 时 间 datetime 
购买 商品 数量 nuber 


K 客户 RERERENCE 17 3E ES 
PLEJ varchar2(20) pk? 
Piin verchard(A) | 
图 9-27 数据 仓库 物理 模型 的 实例 
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地 区 编码 表 中 主要 存储 地 区 编码 、 地 区 名 称 字 段 ,行业 编码 表 中 主要 存储 行业 类 型 编码、 
行业 类 型 名 称 、 父 行业 类 型 编码 等 字段 ， 客 户 历 史 信息 物理 表 可 以 根据 客户 编写 子 段 与 客户 
物理 表 中 的 客户 编号 字段 关联 ， 计 算出 客户 从 不 同 视角 《例如 投 照 不 同行 业 、 不 同 地 区 ) 购 
买 商 品 的 信息 。 

其 中 地 区 编码 表 的 示例 见 表 9-22。 














表 9-22 地 区 编码 表 


地 区 编码 地 区 名 称 
100001 北京 市 
100002 吉林 省 
100003 M38 
100004 黑龙 江 省 
100003 E 
100006 陕西 省 
100007 MEZ 
100008 TES 


行业 编码 表 的 示例 见 表 9-23. 


X 9-23 行业 编码 表 


行业 类 型 编码 父 行业 类 别 编 友 
9001 互联 网 信息 服务 业 010 
9005 人 寿 保险 业 014 
9006 法 律 服务 业 015 


9007 家 居 服 务 业 016 
9008 婚姻 服务 业 017 


客户 物理 表 的 示例 见 表 9-24. 


表 9-24 客户 物理 表 





名 称 w wW ETL 转换 规则 

行业 类 型 编码 根据 行业 类 型 编码 表 转 换 
地 区 编码 根据 地 区 编码 表 转 换 
购买 时 间 从 源 系统 中 直接 抽取 
购买 商品 数量 从 源 系统 中 直接 抽取 








AER: 数据 仓库 物理 模型 是 决 集 分 析 系 统 的 基础 架构 。 它 是 从 ODS 系统 中 抽取 实时 数据 ， 
按照 时 间 点 进行 的 数据 累积 ， 并 且 有 可 能 会 对 数据 进行 轻 度 的 汇总 和 相应 的 计算 和 转换 。 同 
时 在 进行 数据 仓库 物理 模型 设计 时 ， 应 该 按照 主题 的 方式 对 物理 表 进 行 组 织 划 分 ， 可 以 先 选 
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择 小 部 分 很 重要 的 业务 主题 ， 最 后 逐步 扩展 到 所 有 的 业务 主题 中 。 由 于 数据 仓库 存储 的 历史 
数据 量 巨 大 ， 所 以 应 优先 考虑 数据 库 的 存储 优化 。 为 了 保证 数据 仓库 系统 的 高 效 性 ， 物 理 表 
多 采用 分 区 和 使 用 索引 的 方式 进行 设计 ， 同 时 也 要 适当 地 调整 数据 库 参 数 ， 增 加 内 存 的 分 配 
和 CPU 的 个 数 。 


9.5.3 ”数据 集 市 物理 模型 的 设计 


1. 数据 集 市 的 定义 和 结构 

数据 集 市 是 面 癌 特定 部 门 的 ， 是 数据 仓库 的 子 集 ， 其 数据 结构 一 般 包 括 星 型 结构 、 雪 人 花 
型 结构 。 

星 型 结构 主要 包含 两 个 部 分 : PERMER. 事实 表 主 要 由 业务 相关 的 度量 值 和 与 维 表 
相关 联 的 字段 组 成 ， 例 如 人 员 信 息 事 实 表 ， 该 表 包 含 了 单位 编码 、 单 位 类 型 编码 、 部 门 编 
码 、 性 别 编码 、 人 员 ID、 年龄、 工龄 等 信息 。 其 中 单位 编码 、 单 位 类 型 编码 、 部 门 编码 、 
性 别 编码 都 是 与 维 表 相关 联 的 字段 ， 工 龄 是 业务 相关 的 度量 值 。 维 表 用 于 存放 维度 的 有 具体 
言 上 号 ， 例 如 单位 信息 维 表 、 单 位 类型 维 表 、 部 门 维 表 、 性 别 维 表 等 。 星 型 结构 数据 集 市 如 图 
9-28 所 示 。 






























































单位 信息 维 表 | 单位 类 型 维 表 | 
单位 编码 varchar2 (20) Xpk? 单位 类 型 编码 varchar2(20) <pk> 
单位 名 称 varchar2(400) 单杠 类 型 名 称 varchar2(400) 














江 _ 人 员 信 息 表 _ REFERENCE_SK_ 人 员 信 息 表 _REFERENCE_ 单位 类 型 维 表 








人 员 信 息 表 
人 员 ID varchar2(20) 《pk> 


单位 编码 varchar2(20) 《fkl> 
单位 类 型 编码 varchar2(20) 《fk2> 
部 门 编码 varchar2(20) 《fk3> 
性 别 编码 varchar2(20) 《fkd4> 


BT integer 











工龄 integer 


FKA RÍS EE REFERENCE 部 门 维 表 FK_ 人 员 信 息 表 _REFERENCE_ 性 别 维 表 




















^ A 
LIBE € 3 性 别 维 表 
部 门 编码 varchar2(20) 《pk> 性 别 编码 yarchar2(20) <pk> 
部 门 名 称 varchar2(400) 性 别名 称 varchar2(400) 




















图 9-28 星 型 结构 数据 集 市 


由 图 9-28, 可 以 将 事实 表 理 解 成 为 通过 菏 些 字段 进行 分 组 (例如 对 部 门 、 单 位 编码 、 
单位 类 型 、 性 别 进行 分 组 )， 然 后 对 东 些 度量 人 《例如 针对 年 龄 求 平 均值 ) 进行 汇总 计算 
的 数据 集合 。 雪 人 花 型 模式 是 在 星 型 模式 的 基础 上 ， 对 星 型 结构 的 一 种 拓展 。 通 过 对 星 型 
结构 维 表 的 规范 化 和 细 化 ， 逐 步 建 立 起 规范 的 第 三 范式 数据 结构 ， 这 种 结构 在 形式 上 很 
像 雪 伦 的 形状 ， 所 以 被 称 为 雪花 型 结构 。 如 图 9-29 所 示 ， 单 位 类 型 维 表 又 被 分 解 为 事业 
单位 维 表 、 国 有 企业 维 表 、 私 有 企业 单位 维 表 、 外 资 企 业 单位 维 表 。 该 模型 完全 符合 第 
三 范式 的 要 求 , 规范 化 的 处 理 使 得 系统 更 容易 维护 和 更 靳 , 但 是 会 增加 得 询 关联 的 条 件 ， 
牺牲 一 定 的 系统 性 能 。 忆 之 ， 数 据 集 市 的 结构 是 采用 星 型 结构 还 是 雪 伦 型 结构 应 由 业务 
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Xi 4k | CDEYTIS 





i$ varchar2(20)  4pk? | Hi varchar2(20) «pk? | 
[35S varcharz (400) 本 varcharz (400) 
F | 





ARARE REFERENCE fk REGE REFERENCE BD idR: 


pu Sm 


EREL IHR 
= varchar2i20) tipk? e 
T? fs SER PERITO varchar2(20) €fk2) 私有 有 企业 编码 varchar2(20) pk? 
Fey du dE varcharz(20) Cfk12? w 34-8 dele ER varchara (400) 


IV. varcharz(20) «nk? 
E J 由 次 企业 国友 varchar2(20) ¿fkg FERENC 
有 和 a TOR qo 3A varchars(20) fka} 


人 
| ARME EE REFEREM 人员 信息 表 _BREFERENCE 单位 类 型 准 _ 
| PASARA REFERENCE PIE ibd (E: 
|  ABAfRg* | 4 
PRD varcliar2(20 Sukh, HEEL m* 
m varchar2i120) “fkl DIDEGOEEGO——— 
单位 类 型 篇 码 varchar2(20) €Ik2» 外 次 企业 搞 码 varcharz(20) pk? 
28 [1 varchar2(20) cfka» BE desk RM varcharz(400) 
TES varchar? (20) 4Ik4* 
TM integer 


rË inleger 


t JL BUR. REFERENCE RINER 人 员 信息 表 REFERENCE 性 别 维 


P s | A 
EITE £3 TE MS 
HJARA varcharz(270) dnk? PELO varcharz(20) sok? 
WMA varchar2(400) EUA varcharZ (400) 


图 9-29 雪花 型 数据 集 市 

2. 数据 集 市 的 作用 和 特点 

数据 集 市 的 作用 和 特点 〈 见 网 9-300 有 以 下 儿 个 方面 : 

D 数据 集 市 主要 针对 企业 的 某 个 具体 部 门 ， 或 者 某 些 个 性 化 的 应 用 。 数 据 集 市 设计 开发 
的 复杂 上 度 和 周期 相对 于 数据 仓库 来 说 较 小 ， 用 户 可 以 很 快 地 从 数据 集 市 中 获得 需要 的 信息 。 

2) 数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 被 看 做 是 数据 仓库 的 子 集 ， 主 要 面 癌 特定 的 应 用 。 

3) 数据 集 市 主要 包含 两 种 类 型 的 数据 : 汇总 型 数据 和 详细 数据 。 

4) 数据 集 市 的 维 表 主 要 是 围绕 事实 表 建 立 起 来 的 ， 它 和 事实 表 是 主键 与 外 键 的 关系 。 

















数据 集 市 主要 针对 企业 的 具体 某 个 部 门 ， 或 者 某 些 个 性 化 的 应 用 





数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 看 做 是 数据 仓库 的 子 集 


数据 集 市 主要 包含 汇总 型 的 数据 和 详细 数据 









数据 集 市 的 维 表 主 要 是 围绕 事实 表 建 立 起 来 的 ， 它 和 事实 表征 
E 主键 与 外 键 的 关系 x 


图 9-30 ”数据 集 市 的 作用 和 特点 





3. 数据 集 市 的 构建 方法 
(1) 构建 数据 集 市 的 一 般 方 法 
构建 数 扰 集 市 的 一 般 方 法 是 : 通过 ETL 工具 将 业务 系统 中 的 源 数据 抽取 到 数据 仓库 中 ， 
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BERE CBS. ib. fue. Jud. fn AR, Mf eub T] — 3x 
性 ， 有 利于 构建 各 部 门 级 别 的 决策 分 析 系 统 。 但 是 这 种 普通 的 构建 方法 一 般 来 说 开发 的 周 
期 相对 较 长 ， 开 发 成 本 也 较 局 ， 不 易于 针对 用 户 的 意见 及 时 进行 修改 ， 有 活性 相对 较 差 ， 
但 是 它 的 数据 质量 较 品 ， 并 且 能 够 你 证 数据 的 一 任性 和 稳定 性 。 图 9-31 所 示 为 构建 数据 集 
市 的 一 般 方 法 。 

















图 9-31 构建 数据 集 市 的 一 般 方 法 


(2) 构建 数据 集 市 的 特殊 方法 

构建 数据 集 市 的 特殊 方法 是 : 先 设 计 和 开发 小 部 门 级 别 的 数据 集 市 ， 然 后 再 通过 过 渐 递 
增 的 方式 慢 慢 扩大 数据 集 市 的 规模 ， 最 后 将 各 个 数据 集 市 集成 到 数据 仓库 中 。 这 种 方法 开 友 
周期 较 短 ， 开 发 成 本 较 低 ， 能 针对 用 户 意 见 及 时 进行 修改 和 调整 ， 不 仅 增 加 了 开发 的 只 活性 ， 
也 弥补 了 从 业务 源 数据 抽取 到 数据 仓库 中 ， 再 经 过 数据 的 抽取 、 清 洗 、 转 换 、 加 载 ， 最 后 汇 
总 到 数据 集 市 中 的 缺陷 。 但 是 这 种 方法 有 一 定 的 局 限 性 ， 首 先 从 数据 集 市 集成 到 数据 仓库 中 ， 
因为 业务 规则 的 不 同和 数据 格式 的 不 一 致 性 ， 增 大 了 集成 的 困难 ， 同 时 由 于 数据 集 市 的 逐渐 
增多 ， 用 户 进行 必要 的 关联 得 询 和 区 叉 租 询 ， 会 增 大 数据 集 市 乙 间 关 联 的 复杂 度 ， 降 低 系统 
的 性 能 ， 同 时 也 会 影响 数据 集 市 集成 到 数据 仓库 中 的 效率 。 图 9-32 所 示 为 构建 数据 集 市 的 特 
殊 方 法 。 



































图 9-32 ”构建 数据 集 市 的 特殊 方 该 
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(3) 构建 数据 集 市 的 混合 型 方法 

结合 上 和 面 丙 种 方法 的 优 鲜 后， 人 们 通 肖 希望 既 能 绚 短 开发 周期 ,减少 成 本 ， 增 大 开 友 的 灵活 
性 ， 同 时 又 能 及 时 地 根据 用 户 的 需求 和 意见 进行 相应 的 调整 和 修改 ， 你 证 数据 的 一 致 性 和 数据 的 
质量 ， 所 以 出 现 了 构建 数据 集 市 的 混合 型 方法 ， 如 图 9-33 所 示 。 首 先 根 据 业 务 需 求 ， 业 务 源 数 
据 经 过 ETL 过 程 将 数据 抽取 到 企业 的 数据 仓库 中 , 数据 仓库 存储 了 大 量 的 历史 数据 、 汇 总 的 数据 
和 共享 的 数据 , 同时 部 门 级 别 的 数据 集 市 经 过 ETL 过 程 直接 从 源 数据 中 抽取 数据 , 并 且 加 载 到 数 
据 集 市 中 。 各 部 门 的 决策 分 析 者 可 以 下 接 从 数据 集 市 中 获得 决策 信息 ， 并 能 迅速 地 作出 决断 。 数 
据 集 市 中 有 一 部 分 数据 经 过 汇总 或 者 计算 ， 直 接 将 历史 数据 或 者 共 孚 数据 加 载 到 数据 仓库 中 ， 这 
样 既 减 少 了 开发 的 成 本 ， 同 时 又 保证 了 数据 的 一 致 性 ， 并 且 满 足 了 决 案 分 析 的 需求 。 


diam 部 门 级 别 的 决策 
决策 分 析 者 分 析 老 
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ETL 过 程 


L dL dL dL dE dE 


ciim 
源 数据 | | 源 数据 」 | 源 数据 | | 源 数据 | | 源 数据 | ”| 源 数据 


图 9-33 构建 数据 集 市 的 混合 型 方法 
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总 结 : 不 论 选择 哪 种 构建 数据 集 市 的 方法 ， 都 是 由 数据 集 市 所 属 部 门 的 需求 决定 的 。 只 
有 通过 对 现 有 应 用 系统 的 分 析 和 对 业务 需求 的 理解 , 才能 制定 出 合适 的 构建 数据 集 市 的 方法 。 

4. 数据 集 市 物理 表 的 命名 规则 和 创建 过 程 

数据 集 市 的 事实 表 结 构 命 名 规则 一 般 是 FACT 所 在 主题 域 的 英文 简写 表 的 名 称 ， 例 如 
FACT ORGAN PERSONINFO. 

数据 集 市 的 维 表 结构 命名 规则 一 般 是 DIM 所 在 主题 域 的 英文 简写 表 的 名 称 ， 例 如 
DIM ORGAN GENDER。 

创建 事实 表 的 过 程 如 下 : 

1) 为 事实 表 中 的 每 个 维 建立 外 键 ， 与 维度 表 中 的 主键 进行 关联 。 

2) 为 事实 表 至 少 建立 一 个 度量 字段 。 

3) 为 事实 表 建 立 适 当 的 索引 ， 以 提高 查询 效率 。 

创建 维 表 的 过 程 如 下 : 

D 为 每 个 维 表 建立 关键 字段 。 

2) 为 每 个 维 表 建 立 各 自 的 属性 字段 ， 例 如 性 别 维 表 ， 它 的 关键 字段 是 GENDER D, 它 
的 属性 字段 就 是 GENDER NAME， 用 以 描述 每 个 关键 字段 对 应 一 个 名 称 值 。 

3) 为 维 表 建 立 必要 的 约束 条 件 。 
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9.6 ”本 章 小 结 


1) ODS 是 各 个 业务 系统 之 间 共 至 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 
之 间 的 缓冲 区 。 

2) 数据 仓库 是 一 个 面 癌 主题 的 、 集 成 的 、 不 易 丢 失 的 ， 并 且 随 时 间 变 化 的 帮助 企业 管理 
人 员 决 东 分 析 的 数据 集合 。 

3) 数据 集 市 是 在 数据 仓库 的 基础 上 创建 起 来 的 ， 根 据 各 个 业务 部 门 的 不 同 需 要 ， 对 数据 
仓库 中 的 数据 进行 高 度 汇总 、 计 算 。 数 据 集 市 的 作用 是 创建 一 组 特定 的 、 针 对 菏 个 主题 域 或 
者 部 门 的 特殊 数据 集合 。 一 般 来 说 ， 数 据 集 市 的 模型 都 采用 星 型 模式 或 雪花 型 模式 。 

4) 企业 数据 模型 转换 到 数据 仓库 数据 模型 的 步 又: 忆 在 企业 模型 中 有 条 件 地 选择 数据 仓 
库 需 要 的 数据 。 包 为 企业 模型 的 每 个 实体 都 增加 时 间 键 。 信 确定 数据 仓库 的 粒度 。 人 外 汇总 企 
业 模型 中 的 数据 。 岛 根据 数据 仓库 的 特点 合并 企业 模型 中 的 一 些 实体 。 

5) 概念 模型 是 最 局 层次 的 数据 模型 ， 它 定义 了 核心 的 业务 概念 及 其 关系 。 概 念 模型 的 分 
析 通 第 是 以 企业 模型 为 基础 的 ， 而 企业 模型 主要 摘 述 企业 内 部 的 组 织 结 构 和 企业 经 营 活 动 状 
况 等 信息 。 

6) ODS 迪 辑 模型 俊 计 是 通 过 ODS 统一 信息 视图 区 集成 各 类 业务 系统 的 源 数 据 ， 以 数据 
主题 域 作为 设计 的 基础 -ODS 统一 信息 视图 区 有 选择 性 地 集成 各 类 业务 系统 的 数据 ,通过 ETL 
数据 抽取 、 转 换 、 加 载 与 业务 系统 进行 交互 ， 它 主要 保存 与 主题 相关 的 、 实 时 性 的 信息 ， 因 | 
此 ODS 统一 信息 视图 区 具有 准 实时 性 的 特点 ;而 业务 系统 的 数据 通过 一 定 的 时 间 间 隅 ,最终 
以 主题 的 形式 反映 到 ODS 统一 信息 视图 区 中 。 

D 数据 仓库 旬 辑 模型 是 对 概念 模型 的 进一步 细 化 和 分 解 ， 主 要 描述 了 实体 、 属 性 以 及 实 
体 之 间 的 关系 。 

8) 数据 集 市 是 针对 特定 的 条 个 主题 域 ， 或 者 按照 部 门 进行 划分 的 数据 集合 。 

9) ODS 物理 模型 的 作用 。( 能 够 从 各 个 系统 抽取 企业 的 业务 数据 ， 通 过 ETL 完成 数据 
的 整合 ， 为 企业 近 供 全 局 统一 的 数据 视 网 。 包 为 企业 捉 供 数据 共享 的 功能 ， 消 除数 据 不 一 至 
的 可 能 。 

100 数据 仓库 物理 模型 的 作用 。 届 数据 仓库 物理 模型 又 持 企 业 的 决 全 分析， 并 且 能 够 根 
据 业 务 的 需求 对 不 同 的 得 询 频 率 采 取 不 同 的 设计 方法 。 包 数据 仓库 存储 了 大 量 的 历史 数据 ， 
这 此 历史 效 据 能 够 根据 物理 模型 组 织 成 统一 的 存储 模型 ， 包 括 对 数据 的 汇总 、 转 换 和 计算 ， 
以 支持 企业 的 决 全 分析。(3) 数 据 仓 库 物理 模型 是 数据 仓库 逻辑 模型 在 数据 库 系 统 中 的 实现 方 
式 。(4) 数 据 仓 库 物理 模型 为 企业 各 级 业务 人 员 、 分 析 人 员 近 供 统 一 的 数据 视图 。 

11) 数据 集 市 是 面向 特定 部 门 的 ， 是 数据 仓库 的 子 集 ， 其 数据 结构 一 般 包 括 星 型 结构 、 
雪 化 型 结构 。 星 型 结构 主要 包 合 两 个 部 分 : 事实 表 和 维 表 。 事 实 表 主要 由 业务 相关 的 度量 值 
和 与 维 表 相 关联 的 字段 组 成 。 雪 伦 型 模式 是 在 星 型 模式 的 基础 上 ， 对 星 型 结构 的 一 种 拓展 。 
通过 对 星 型 结构 维 表 的 规范 化 和 细 化 ， 逐 步 建 立 起 规范 的 三 范式 数据 结构 ， 这 种 结构 在 形式 
上 很 像 雪 伦 的 形状 ， 所 以 被 称 为 雪 化 型 结构 。 

12) 数据 集 市 的 作用 和 特点 。(D 数 据 集 市 主要 针对 企业 的 具体 茶 个 部 门 ， 或 者 菜 些 个 性 
化 的 应 用 。 效 据 集 市 设计 开发 的 复杂 度 和 周期 相对 数据 仓库 来 说 较 小 ， 用 户 可 以 很 快 地 从 效 
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据 集 市 中 获得 需要 的 信息 。 包 数据 集 市 是 数据 仓库 的 缩小 版 ， 也 可 以 家 看 做 是 数据 仓库 的 子 
集 ， 主 要 和 面向 特定 的 应 用 。(B) 数 据 集 市 主要 包含 两 种 类 型 的 数据 : 汇总 型 数据 和 详细 数据 。 
(数据 集 市 的 维 表 主要 是 围绕 事实 表 建 立 起 来 的 ， 它 和 事实 表 是 主键 与 外 键 的 关系 。 

13) 数据 集 市 的 构建 方法 。( 岂 构建 数据 集 市 的 一 般 方 法 是 : 通过 ETL 工具 将 业务 系统 中 
的 源 数 据 抽 取 到 数据 仓库 中 ， 再 经过 多 次 数据 抽取 、 清 洗 、 转 换 、 加 载 ， 最 后 汇总 到 数据 集 
市 中 。 色 构建 数据 集 市 的 特殊 方法 是 : 移 设 计 和 开 妈 小 部 门 级 别 的 数据 集 市 ， 然 后 再 通过 逐 
浙 违 增 的 方式 ， 慢 慢 扩 大 数据 集 市 的 规模 ， 最 后 将 各 个 数据 集 市 集成 到 数据 仓库 中 。(B) 构 建 
数据 集 市 的 混合 型 方法 是 : 首先 根据 业务 需求 ， 业 务 源 数据 经 过 ETL 过 程 将 数据 抽取 到 企业 
的 数据 仓库 中 ， 数 据 仓 库存 储 了 大 量 的 历史 数据 、 汇 总 的 数据 和 共 吾 的 数据 ， 同 时 部 门 级 别 
的 数据 集 市 经 过 ETL 过 程 下 接 从 源 数据 中 抽取 数据 ， 并 且 加 载 到 数据 集 市 中 ， 数 据 集 市 中 有 
一 部 分 数据 经 过 沪 忆 或 者 计算 ， 和 直接 将 历史 数据 或 者 共 诗 数据 加 载 到 数据 仓库 中 。 
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第 10 章 商业 智能 数据 仓库 系统 应 用 实例 


本 章 目标 

通过 本 章 的 和 学习， 读者 会 熟悉 疝 业 智能 决策 分 析 系 统 部 甘 的 一 般 步 又 和 方法 ， 包 括 如 何 
定义 数据 仓库 项 目的 生命 周期 ， 数 据 仓 库 粒 度 划 分 ， 企 业 辅助 决 打分 析 系 统 构 建 的 过 程 ， 系 
统 软 件 的 体系 结构 、 数 据 法 癌 的 体系 结构 、 业 务 库 环境 的 部 闭 、ODS 环境 的 部 闭 、 数 据 仓 库 
和 数据 集 市 环境 的 部 车、ETL 和 报表 展示 环境 的 部 普 等 内 容 。 

FAFE, KKJ: 

e 如 何 定 义 数 据 仓库 项 目的 生命 周期 。 

e 数据 仓库 粒度 的 划分 。 

e 企业 辅助 决策 分 析 系 统 的 构建 。 

e PINE BERR TIRRI RAN RMR 

















10.1. 定义 效 据 仓库 项 目的 生命 周期 








为 了 达到 数据 仓库 项 目 质量 管理 的 要 求 ， 可 以 选择 合适 的 模型 建立 数据 仓库 项 目的 生命 
周期 。 例 如 ， 用 瀑布 模型 或 者 原型 模型 定义 生命 周期 。 

(1) 使 用 瀑布 模型 的 条 件 

从 用 户 的 角度 来 说 ， 他 们 已 经 完全 理解 项 目的 需求 ， 并 且 有 现成 的 文档 作为 文 持 ， 同 时 
用 户 和 希望 用 新 系统 答 代 旧 的 系统 ， 并 且 项 目 工期 相对 紧迫 。 

从 项 目 开 友人 员 的 角度 来 次 ， 项 目 分 工 明 确 ， 资 源 序 足 ， 系 统 可 以 家 划分 成 相对 独立 的 
模块 ， 比 较 适 合 工作 任务 的 分 配 。 

(20 使 用 原型 模型 的 条 件 

没有 完整 的 需求 定义 ， 系 统 开 有 的 规模 过 于 庞大 ， 没 有 现成 的 文档 文 持 ， 用 户 对 项 目 需 
求 的 理解 比较 模糊 。 

项 目的 生命 周期 主要 包含 以 下 儿 个 部 分 : 需求 分 析 、 构 建 数 据 模型 、 应 用 功能 的 开发 和 
测试 、 系 统 实施 和 部 车、 系统 运行 并 验收 ， 如 图 10-1 所 示 。 其 中 ,需求 分 析 包 括 : 需求 调研 ， 
需求 得 到 用 户 确 认 ， 建 立 一 套 验收 标准 。 应 用 功能 的 开 有 友和 测试 包括 : 系统 总 体 的 设计 、ETL 
的 设计 、 报 表 展 现 的 设计 ， 对 应 用 系统 的 单元 测试 、 集 成 测试 、 用 户 测 试 。 系 统 实施 和 部 普 
包括 : 数据 仓库 系统 的 部 普 ， 数 据 的 初始 化 工作 ， 对 用 户 的 系 



































统 培训 ， 整 体 功 能 测试 等 工作 。 系 统 运行 并 验收 包括 : 用 户 的 e 9. 

. ; E " E $ ; : zs 2 MIL 

集中 使 用 ， 系 统 是 人 否 达 a 到 预期 目标 ， 系 统 的 调 优等 内 容 。 eru LL 运行 

regn 大 H- 
9 Gs be 和 
"T "S : e |. Ah 中 NDA i 
10.2 数据 仓库 粒度 的 划分 pe 模型 an 
ITNT 测试 
数据 仓库 粒度 的 划分 是 设计 的 重要 内 容 ， 因 为 它 直 接 影响 了 图 10-1 项 目的 生命 周期 
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数据 仓库 奏 询 的 效率 、 碍 询 的 元 活 性 和 数据 仓库 数据 量 的 大 小 。 所 请 粒度 ， 是 指数 据 仓 库 中 单位 数 
据 细 化 程度 的 融 低 ， 如果 单位 数据 的 细 化 程度 越 蜗 ,说 明 数 据 仓库 粒度 的 级 列 越 低 ; 有 反之, 则 相反 。 

图 10-2 所 示 为 我 国 3 个 月 之 内 各 个 地 区 地 许 活 动 的 细节 和 3 个 月 之 内 各 个 地 区 地 震 活 动 
的 综合 情况 。 





低 细 市 级 


发 震 时 刻 平均 震级 


纬度 


经 度 地 震 的 次 数 
震级 
地 区 

图 10-2 mA TRARA TRAS] 


图 10-2 REE ANA, EREE, MERARI, F 
活动 的 日 期 、 地 震 时 刻 都 被 详细 记录 下 来 。 粒 度 级 别 低 ， 可 以 问答 大 量 的 问题 ， 例 如 在 不 同 的 日 
期 时 段 内 ， 不 同 的 纬度 、 经 度 、 深 度 、 震 级 等 地 震 情况 的 详细 信息 ， 但 是 数据 存储 量 巨大 ， 占 用 
的 空间 多 。 右 疼 是 一 个 细节 化 程度 低 ， 但 是 粒度 级 别 高 的 例子 ， 记 录 了 3 个 月 乙 内 ， 总 的 地 震 次 
数 ， 影 响 地 区 的 数量 等 综合 信息 ， 这 样 可 以 大 大 节省 存储 空间 ， 碍 询 的 效率 也 随 之 所 高 ， 但 是 碍 
询 的 灵活 性 却 降 低 了 ， 其 问题 处 理 能 力也 相应 减弱 了 。 所 以 在 数据 仓库 设计 过 程 中 ， 应 该 避 重 考 
虑 粒度 的 问题 ， 既 要 满足 所 有 的 合 询 需求 ， 也 需要 考 在 俘 询 的 效率 、 和 存储 的 空间 等 情况 。 


10.3 ”企业 辅助 决策 分 析 系 统 的 构建 


企业 辅助 决策 分 析 系 统 侧 重 于 决策 分 机 ， 实 现 从 不 同 地 区 、 不 同时 间 、 不 同行 业 等 多 种 角 
度 对 具体 指标 的 分 析 ， 从 而 支持 业务 的 各 种 分 析 和 需求 。 在 企业 辅助 决策 分 析 系 统 中 ,报表 展 示 、 
应 用 分 析 和 数据 集 市 的 构建 多 采用 专业 的 商业 管 能 工具 ， 数 据 仓 库 、ODS 统一 信息 视图 区 多 米 
用 数据 仓库 的 技术 进行 构建 ， 最 下 层 的 信息 系统 是 基于 大 量 的 业务 明细 数据 ， 如 图 10-3 所 示 。 


影响 地 区 的 数量 

























































































图 10-3 ”企业 辅助 决策 分 析 系 统 的 构建 
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10.4. 决 案 分 析 系 统一 般 的 部 署 方案 和 步骤 


10.4.1 提供 系统 安装 软件 的 体系 结 


1. 软件 部 署 的 体系 结构 

在 图 10-4 中 设 定 ETL 工具 为 Informatica， 报 表 展 示 工 具 为 Cognos，Web 应 用 服务 絮 是 
WebLogic, 数据 库 服 务 器 为 Oracle 10g. 其 中 Cognos 部 署 的 资料 库 必 须 是 UTF-8 字符 集 类 型 。 
Cognos 服务 器 又 包含 了 Server、Framework、Transformer， 具 体内 容 将 在 工具 篇 中 详细 介绍 ， 
在 此 不 再 次 述 。 














WebLogic 











知识 库 





Oracle 服务 器 Cognos 服务 器 
Informatica 服务 器 WebLogic 服务 器 


图 10-4 AE BEI 





2. 数据 流向 的 体系 结构 
在 图 10-5 中 可 以 看 出 : 数据 从 业务 库 流向 ODS 统一 信息 视图 区 ， 再 从 ODS 统一 信息 视 
图 区 流 问 数据 仓库 ， 最 后 从 数据 仓库 流 问 数据 集 市 ， 报 表 展 示 古 从 数据 集 市 中 获取 数据 。 

















图 10-5 ”数据 流 癌 的 体系 结构 
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10.4.2 ”部 署 系统 的 数据 库 环 境 


1. 业务 库 环境 的 部 署 

10 建立 业务 数据 库 的 表 空 间 ， 创 建 业 务 数据 库 有 用户， 同时 为 业务 用 户 赋 予 相 应 的 权限 。 
2) 导入 业务 数据 。 

3) 测试 是 否 成 功 建立 业务 数据 库 环境 。 

2. ODS 数 据 库 环境 的 部 署 

1) 为 ODS 数据 库 环 境 建 并 独立 的 表 空 间 。 

2) 创建 ODS 数据 库 用 户 ， 并 且 为 用 户 赋予 相应 的 权限 。 

3) 导入 ODS 数据 。 

4) 更 新 相应 的 数据 库 链 接 。 

5) 测试 是 否 成 功 建立 ODS 数据 库 环 境 。 

3. 数据 仓库 和 数据 集 市 环境 的 部 署 

10 建立 数据 仓库 和 数据 集 市 的 数据 库 用 户 ， 并 且 为 用 户 赋 予 相应 的 权限 。 
2) 执行 导入 表 结 构 和 数据 的 SQL 脚本 。 

3) 建立 连接 数据 仓库 和 数据 集 市 的 数据 库 链 接 。 

4) 测试 数据 仓库 和 数据 集 市 的 环境 是 否 成功 。 


10.4.8 ”ETL 环境 的 部 署 


下 和 耐 以 Informatica 为 例 描述 对 ETL TANI WE o 

D 对 资料 库 的 备份 。 进 入 ETL 后 人 台 ， 选 定 资 料 库 ， 配 置 相 关 信 息 ， 将 资料 库 备 份 到 便 
fT Hx. 

2) 对 资料 库 的 部 普 。 进 入 ETL Jut. WP maA HERRE, RRE 
制 到 ETL 安装 目录 下 ， 最 后 开始 导入 。 

3) 测试 ETL 服务 器 是 否 运 转正 常 。 在 浏览 右 中 输入 http:/+P 地 址 : 端口 号， 进入 到 探 
制 台 主页 面 ， 检 查 页 和 耐 的 主 参 数 状 态 是 否 正 党 。 


10.4.4 ”报表 展示 环境 的 部 署 


Fifi EA Cognos 为 例 描 述 报 表 展 示 环 境 的 部 团 。 

1) 首先 把 .zip 包 放 到 Cognos 安装 目录 deployment F- 

2) 通过 浏览 器 选择 要 部 普 的 .zip 包 。 

3) 修改 配置 信息 ， 进 入 到 Cognos 门户 页 面 ， 修 改 数据 库 的 配置 信息 。 
4) 测试 报表 环境 是 否 正 第 。 












































10.5 本章 小 结 


1) 数据 仓库 项 目的 生命 周期 包括 需求 分 机 、 构 建 数 据 醒 型 、 应 用 功能 的 开发 和 训 试 、 系 
统 实施 和 部 闭 、 系 统 运行 并 验收 。 
2) 数据 仓库 粒度 的 划分 是 设计 的 重要 和 内容， 因为 它 将 直接 影 啊 数据 仓库 奋 询 的 效率 、 碍 
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询 的 灵活 性 和 数据 仓库 数据 量 的 大 小 。 

3) 粒度 是 指数 据 仓 库 中 单位 数据 细 化 程度 的 高 低 ， 如 果 数 据 单 位 的 细 化 程度 越 局 ， 说 明 
数据 仓库 粒度 的 级 别 越 低 ， 反之 ， 则 相反 。 

4) 企业 辅助 决策 分 析 系 统 侧重 于 和 面 回 分 析 决 策 ， 实 现 从 不 同 地 区 、 不 同时 间 、 不 同行 业 
等 多 种 角度 对 具体 指标 的 分 机 ， 从 而 文 持 业 务 的 分 析 需 求 。 

5) 决 宁 分 析 系 统一 般 的 部 普 方 案 和 步骤 : 提供 系统 安装 软件 的 体系 结构 ， 提 供 系统 的 数 
据 库 环境 ， 对 ETL 和 报表 展示 环境 进行 部 普 。 
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SB 113 商业 智能 项 目 规划 和 管理 


本 章 目标 

本 章 内 容 主要 包括 商业 智能 项 目 团队 的 组 织 结构 ， 项 目 角色 的 划分 及 技能 要 求 ， 如 何 定 
义 领 导 组 的 职责 和 主要 任务 、 商 业 智 能 项 目的 进度 ， 以 及 如 何 定义 商业 智能 项 目的 过 程 等 
容 。 在 本 革 中 ， 您 可 以 充当 项 目 领导 者 的 角色 ， 学 会 如 何 实施 商业 智能 项 目 和 如 何 对 项 目 进 
行 细致 的 规划 和 管理 。 

"EAR. SESS 

e i5 MR BEPLH BIBABSZHZA ESI. 

e 项 目 角 色 划 分 及 技能 要 求 。 

e 领导 组 的 职 贡 和 主要 任务 。 

e 如 何 定义 商业 智能 项 目的 进度 。 

e 如 何 定义 商业 智能 项 目的 过 程 。 

















11.1 项 目 团队 的 组 织 结构 


商业 智能 项 目 团 队 通 常 分 成 以 下 角色 : 项 目 经 理 、 业 务 顾 问 、 数 据 模型 架构 师 、ETL T. 
程 师 、 报 表 展 示 工 程 师 、DBA、 最 终 用 户 。 
商业 智能 项 目 团队 的 组 织 结构 如 图 11-1 所 示 。 


网 E 


项 目 经 理 


AG /f^ 
i me 
E 
4^ —; [e 
2 ` | re ^ S 
AN fj |! 
N Wy > 业务 顾问 
| IN — 
报表 展示 工程 师 最 终 用户 
图 11-1 项 目 团 队 的 组 织 结构 


商业 智能 项 目 团队 中 的 角色 及 其 职责 见 表 11-1。 











DBA 






iR 





ETL 工程 师 
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表 11-1 商业 智能 项 目 团 队 中 的 角色 及 其 职责 





m | & Ao x 
项 目 经 理 主要 负责 项 目 评审 和 第 求 分 析 的 工作 ， 到 时 参与 概念 模型 、 闭 辑 模 型 的 设计 。 负 责 星 叔 项 目的 整体 流程 
和 工作 进度 ， 包 括 后 期 维护 工作 的 安排 等 内 容 
业务 顾问 负责 需求 分 析 工 作 、 概 念 模型 和 逻辑 模型 的 设计 工作 
数据 模型 架构 师 负责 概念 模型 、 逻 辑 模 型 和 物理 模型 的 设计 工作 
ETL 工程 师 负责 数据 的 抽取 、 清 洗 、 转 换 和 加 载 
报表 展示 工程 师 负责 报表 的 设计 和 开发 
DBA 负责 数据 库存 储 和 管理 
AHP 参与 项 目的 评审 ， 需 求 分 析 等 工作 


商业 智能 项 目的 流程 如 图 11-2 所 示 ， 主 要 包括 以 下 步骤 : 项 目的 局 动 、 需 求 定 义 、 系 统 
设计 、 系 统 的 开发 和 实现 、 项 目的 实施 和 部 车 、 系 统 的 测试 和 上 线 试 运行 ， 最 后 是 系统 的 优 


化 和 正式 上 线 。 
o) o 
项 目的 实施 和 du 系统 的 开发 和 
部 署 实现 





系统 的 优化 和 
FALZ 


图 11-2 商业 智能 项 目的 流程 


11.2. 项目 角色 划分 及 技能 要 求 
项 目 角色 划分 及 技能 要 求 见 表 11-2。 


表 11-2 项 目 角色 划分 及 技能 要 求 























项 目 角色 TEE 

on 具备 一 年 以 上 的 项 目 经 理工 作 经 验 、 一 定 的 项 目 实施 和 开发 经 验 ， 掌 所 该 项 目的 业务 知识 ， 具 有 软件 

工程 的 思想 ， 熟 悉 项 目 管理 和 商业 智能 理论 方面 的 知识 

"T" 了 解 该 项 目的 业务 知识 ， 具 备 良好 的 沟通 和 表达 能 力 ， 有 相应 的 技术 能 力 ， 具 备 需求 分 析 和 需求 管理 

的 经 验 ， 对 商业 智能 的 整体 架构 思想 有 一 定 的 认识 

m JL GENTE AEN, TAEA, HERRES, died 

模 知 识 和 数据 库 设计 ， 熟 悉数 据 仓 库 理 论 和 商业 知 能 的 政体 架构 思想 

"m 具备 一 定 的 软件 编程 经 验 ， 党 据 完 整 的 数据 仓库 理论 知识 和 数据 仓库 开发 经 验 ， 具 备 商 业 智能 的 整体 
架构 思想 ， 有 ETL 设计 开发 和 报表 设计 开发 经 验 ， 掌 所 数据 库 方面 的 知识 

m 具备 该 项 目的 业务 知识 ， 熟 悉 软 件 的 测 斌 方法， 具备 一 定 的 质量 管理 方面 的 理论 知识 ， 熟 悉 商 业 知 能 

A 的 整体 架构 思想 

实施 维护 人 员 了 解 该 项 目的 业务 知识 ， 熟 悉 商 业 知 能 的 整体 架构 思想 ， 具 备 一 定 的 问题 解决 能 力 和 判断 能 
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11.3 ”定义 领导 组 的 职责 和 主要 任务 














领导 组 成 员 的 主要 职责 就 是 确定 工作 的 目标 、 评 审 工 作 的 结果 和 确定 不 同 岗 位 的 主要 负 
责 人 。 项 目 领 导 组 的 主要 任务 包括 : 确定 公司 对 项 目的 进度 安排 、 工 作 的 主要 方法 ， 验 收 审 
核 项 目 各 个 阶段 的 不 同 成 果 等 内 容 。 在 商业 智能 项 目 开 发 过 程 中 ， 需 要 制定 项 目的 各 种 管理 规 
泡 和 规章 制度 ， 确 定 项 目 组 人 员 的 岗位 和 职责 ， 规 范 各 种 开 友 文档 ， 监 督 项 目的 执行 情况 。 具 
体 如 图 11-3 所 示 。 









































领导 组 的 职责 和 主要 任务 


。 确 定 工作 的 目标 、 评 审 工作 的 结 采 
。 确 定 不 同 岗位 的 主要 负责 人 
。 确 定 公 司 对 项 目的 进度 安排 、 工 作 





的 主要 方法 

« 验收 审核 项 目 各 个 阶段 的 不 同 成 果 
« 制定 项 目的 管理 规范 和 规章 制度 
“规范 各 种 开发 文档 ， 监 督 项 目的 执 
行情 况 








图 11-3 领导 组 的 职责 和 主要 任务 


11.4 ”如何 定义 商业 智能 项 目的 进度 


制订 商业 智能 项 目 进度 计划 的 方法 有 两 种 。 

1) 定义 项 目的 任务 ， 任 务 的 开始 时 间 、 结 束 时 则 、 所 需要 的 资源 等 信息 。 例 如 ， 将 商业 
智能 项 目 分 成 以 下 几 个 阶段 : 对 现 有 系统 的 分 机 、 调 研 ， 概 念 模型 的 设计 、 提 交 ， 渴 辑 模型 
的 设计 、 提 交 ， 物 理 模型 的 设计 、 提 交 ，ETL 的 设计 与 开发 ， 报 表 展 示 的 设计 与 开发 ， 见 
表 11-3。 








表 11-3 商业 智能 项 目的 进度 计划 


B 所 需要 的 资源 其 他 
概念 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 和 调研 人 员 
邮 辑 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 和 调研 人 员 
物理 模型 的 设计 、 提 交 项 目 组 的 模型 设计 人 员 


2) 根据 项 目的 不 同 阶段 可 以 分 成 : 需求 定义 阶段 、 设 计 阶 段 、 实 现 阶 段 、 测 试 阶段 、 友 
布 阶段 、 实 施 部 草 阶 段 、 项 目 验 收 阶 段 ， 见 表 11-4. 
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表 11-4 商业 智能 项 目的 不 同 阶段 


阶段 一 务 的 开始 时 间 | 任务 的 结束 时 间 工作 成 果 





HFK + ERM 


智能 项 目的 概要 设计 、 详 





PEDES nus ETL 设计 、 报 表 设计 lx Ww l1 提交 设计 说 明 下 
测试 阶段 NLIS x 用 户 测 exi mes | ERR 测试 
发 阶段 | mem o —  (20msi — 20261 | | 
swaum | — 系统 部 署 Me ———— [200261 (zri | o 


系统 正式 提交 给 用 户 , 用 户 根 


ri zw 


11.5 ”如 何 定 义 商 业 知 能 项 目的 过 程 

















商业 智能 项 目的 过 程 一 般 包 括 以 下 儿 个 需求 开 有 发、 商业 智能 项 目的 开发 计划 、 
业 智 能 项 目的 设计 、 丙 业 和 省 re 项 目的 测试 、 商 业 逢 、 
和 发 布 、 丙 业 乔 能 项 目的 验收 ， 如 图 11-4 所 示 。 













商业 智能 
项 目的 验收 







商业 智能 
项 目的 实现 
过 程 


ATA 





图 11-4 商业 智能 项 目的 过 程 


1) 需求 开发 : 包括 制订 需求 开发 计划 、 根 据 调 研 结 东 进行 需求 整理 。 成 末 包 括 需 求 计 划 
说 明 书 、 用 户 需 求 说 明 书 、 软 件 需 求 说 明 书 等 。 

2) 商业 智能 项 目的 开发 计划 : 包括 对 商业 智能 项 目的 估算 、 制 订 商 业 智 能 项 目的 计划 、 
项 目的 需求 计划 变更 等 内 容 。 成 果 包 括 商 业 智 能 项 目的 计划 书 、 项 目 计划 评审 书 、 项 目 配置 
管理 次 明 书 、 项 目 风险 管理 计划 说 明 书 等 。 

3) 商业 智能 项 目的 设计 : 包括 商业 智能 项 目 概 要 设计 、 商 业 智 能 项 目 详细 设计 、ETL Uc 
计 、 报 表 设 计 等 内 容 。 成 果 包 括 商 业 和 党 能 项 目 概要 设计 说 明 书 ， 详 细 设 计 说 明 书 、ETL 设计 
说 明 书 、 报 表 设 计 说 明 书 、 数 据 库 设计 说 明 书 等 。 

4) 商业 智能 项 目的 实现 过 程 : 包括 代码 的 编写 、ETL 的 开发 、 报 表 的 开 肥 、 单 元 测试 等 

121 




















内 容 。 成 采 包 括 项 目的 源 代 码 、 代 但 抽 碍 记录 、 程 序 的 清单 、 用 户 的 手册 、 单 元 测试 记录 等 。 

5) 商业 智能 项 目的 测试 : 包括 项 目的 集成 测试 、 用 户 测 试 等 内 容 。 成 东 包 括 商 业 智 能 项 
目 集成 名 试 计 划 说 明 书 、 集 成 测试 的 用 例 、 集 成 测试 的 结 琳 报告 等 。 

6) 商业 智能 项 目的 实施 和 发 布 : 包括 系统 的 发 布 、 产 品 的 实施 、 用 户 的 堪 训 、 日 利 问 题 
的 处 理 等 内 容 。 成 来 包括 项 目 实 施 计 划 说 明 书 、 实 施 评审 结果 记录 、 系 统 安 准 的 配置 说 明 书 、 
系统 日 党 维护 说 明 书 、 系 统 生产 环境 说 明 书 、 用 尸 培训 说 明 书 等 。 

7) 商业 管 能 项 目的 验收 :主要 成 来 包括 项 目 验 收报 告 等 。 
































11.6 本章 小 结 


D 商业 智能 项 目 团队 通 第 分 成 以 下 角色 : 项 目 经 理 、 业 务 顾问 、 数 据 模型 染 构 师 、ETL 
工程 师 、 报 表 展 示 工 程 师 、DBA、 最 终 用 户 。 

2) 项 目 领导 组 的 主要 任务 包括 : 确定 公司 对 项 目的 进度 安排 、 工 作 的 主要 方法 ， 验 收 审 
核 项 目 各 个 阶段 的 不 同 成 果 等 内 容 。 

3) 制订 商业 智能 项 目的 进度 计划 有 两 种 方法 : WD 定义 项 目的 任务 ,任务 的 开始 时 间 、 结 
束 时 间 、 所 需要 的 资源 等 信息 。 忆 根据 项 目的 不 同 阶段 可 以 分 成 : 需求 定义 阶段 、 设 计 阶 段 、 
实现 阶段 、 测 试 阶段 、 发 布 阶 段 、 实 施 部 署 阶段 、 项 目 验 收 阶段 。 

4) 商业 智能 项 目的 过 程 一 般 包 括 以 下 几 个 部 分 : 需求 开发 、 商 业 智 能 项 目的 开发 计划 、 
商业 智能 项 目的 设计 、 商 业 智 能 项 目的 实现 过 程 、 商 业 智 能 项 目的 测试 、 商 业 智 能 项 目的 实 
施 和 发 布 、 丙 业 智 能 项 目的 验收 。 
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第 12 章 ”数据 抽取 、 转 换 和 加 载 


本 章 目 标 

本 章 主 要 介绍 ETL 的 定义 和 总 体 架 构 、ETL 的 流程 、ETL 的 加 载 策略 、 利 用 ETL 构建 
企业 级 数据 仓库 、ETL 的 设计 过 程 、ETL 的 备份 与 恢复 等 内 容 。 

学 习 本 章 后 ， 您 将 掌握 : 

e ETL 的 体系 结构 。 

@ ETL 的 一 般 设 计 流 程 。 

e ETL 的 一 般 加 载 方法 。 

@ ETL 的 备份 与 恢复 。 





12.1 ETL 的 定义 和 总 体 架构 





ETL 是 数据 抽取 (Extract)、 转 换 (Transform)、 加 载 (Load) 的 简写 ， 它 吐 窒 了 整个 商业 智能 项 
目 ， 是 构建 数据 仓库 最 重要 的 一 步 。 系 统 通 过 ETL 过 程 将 数据 源 中 的 数据 经 过 转换 和 整合 加 载 
到 数据 仓库 中 。 下 和 面 对 ETL 功能 架构 中 的 抽取 、 清 洗 、 转 换 、 加 载 等 内 容 进 行 许 细 的 介绍 。 

(1) 抽取 

抽取 是 源 数据 进入 到 数据 仓库 中 的 第 一 步 。 因 为 每 个 业务 系统 数据 的 质量 各 不 相同 ， 所 
以 需要 对 每 个 数据 源 建 立 不 同 的 抽取 程序 ， 而 抽取 的 目的 耽 是 将 这 些 数 据 源 中 的 数据 抽取 出 


来 ， 传 递 给 下 一 阶段 中 的 清洗 步骤 。 
提供 批 处 
理 的 服务 


抽取 的 主要 功能 如 图 12-1 所 示 。 
und 提供 数据 
提供 标准 抽取 的 提供 数 
化 的 功能 p s 























图 12-1 抽取 的 主要 功能 


D 提供 数据 适配器 的 功能 : 数据 抽取 的 功能 应 该 包含 对 数据 适配器 的 支持 ,使 得 抽取 程 
序 可 以 与 多 种 业务 数据 源 相 连接 。 一 般 来 说 ， 源 数据 适 配 帮 包含 对 JDBC, ODBC, XML 等 
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2) 提供 标准 化 的 功能 : 抽取 最 重要 的 一 个 功能 驶 是 对 数据 类 型 的 标准 化 ， 将 业务 数据 源 
和 数据 仓库 中 的 数据 类 型 统一 。 

3) 提供 批 处 理 的 服务 : 主要 负责 抽取 流程 的 启动 、 监 控 任 务 的 执行 、 对 批 处 理 任务 的 重 
局 恢复 、 目 动 调度 抽取 程序 等 。 一 般 使 用 成 熟 的 ETL 工具 去 完成 复杂 的 监控 处 理 。 

4) 提供 过 滤 的 功能 : 抽取 程序 可 以 根据 实际 的 需要 ， 为 业务 数据 源 提供 过 滤 的 功能 ， 以 
保证 数据 的 质量 。 

(2) 清洗 

清洗 是 源 数据 进入 到 数据 仓库 中 的 第 二 步 。 清 洗 的 目的 是 保证 源 数据 的 数据 质量 符合 
数据 仓库 的 要 求 ， 同 时 保证 数据 的 一 致 性 。 清 洗 程 序 可 以 分 成 两 类， 如 网 12-2 所 示 。 当 业 
务 系统 源 数据 的 清洗 规则 和 处 理 流程 各 不 相同 时 ， 为 了 保证 数据 的 一 致 性 ， 可 以 对 不 同 的 
业务 源 数据 编写 各 目 专 用 的 清洗 程序 ， 当 所 有 业务 系统 源 数 据 的 清洗 规则 和 处 理 流 程 都 相 
同时 ， 可 以 编写 通用 的 清洗 程序 ， 从 而 保证 数据 的 质量 和 数据 的 一 致 性 。 当 然 ， 在 编写 通 
用 清洗 程序 的 时 候 ， 为 了 满足 业务 的 需求 ， 减 少 代 但 的 重复 ， 可 以 通过 编写 通用 函数 的 方 
式 去 处 理 相 同 的 清洗 规则 和 处 理 流程 ， 以 达到 提高 系统 效率 、 减 少 代 码 编写 量 的 目的 。 

清洗 的 主要 功能 如 图 12-3 所 示 。 

10 数据 修正 功能 : 使 用 固定 算法 或 者 相应 的 数据 源 检 得 程序 去 验证 信息 是 否 准 确 。 

2) 数据 标准 化 功能 : 将 业务 数据 源 的 数据 标准 化 ,以 满足 数据 仓库 中 的 数据 一 致 的 要 求 。 

3) 匹配 与 合并 功能 : 对 抽取 出 来 的 数据 进行 重复 验证 ， 然 后 对 重复 数据 进行 单独 合并 。 















































数据 修 
正 功能 


T 
清洗 的 
主要 功能 

专用 清洗 通用 清洗 匹配 与 n 数据 标 
程序 程序 合并 功能 准 化 功能 


图 12-2 ”清洗 程序 的 分 类 图 12-3 ”清洗 的 主要 功能 

(3) 转换 

转换 是 源 数据 进入 到 数据 仓库 中 的 第 三 步 ， 也 是 最 重要 的 一 个 步骤 。 转 换 在 抽取 和 清洗 的 
基础 上 对 源 系统 所 抽出 的 数据 进行 操作 ， 是 业务 系统 数据 进入 到 数据 仓库 中 的 最 后 一 次 修改 。 

转换 的 主要 功能 如 图 12-4 所 示 。 

1) 对 数据 进行 计算 : 根据 业务 需求 的 特点 对 业务 源 数据 进行 相关 的 计算 ， 以 满足 数据 仓 
库 的 要 求 。 

2) 对 数据 进行 放大 : 根据 实际 的 业务 需求 ， 为 数据 添加 额外 的 信息 ， 从 而 保证 数据 仓库 
的 一 致 性 和 正确 性 。 

(4) 加 载 

加 载 是 ETL 过 程 中 的 最 后 一 步 。 它 主要 负责 将 数据 加 载 到 目标 表 中 ， 这 些 目标 表 可 能 是 
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事实 表 ， 也 可 能 是 维度 表 。 加 载 最 重要 的 作用 丈 古 按照 数据 模型 中 各 个 实体 之 则 的 关系 将 抽 
取 的 数据 加 载 到 目标 表 中 ， 使 用 代理 键 谷 换 原 来 的 主键 或 者 外 键 〈 代 理 键 一 般 是 用 在 OLAP 
的 星 型 模型 中 ， 通 过 添加 一 个 序列 作为 该 表 的 主键 值 ， 目 的 是 防止 修改 源 表 信 息 后 同时 修改 
历史 数据 信息 ， 加 入 代理 键 的 作用 就 是 当 源 表 的 茶 条 记录 被 修改 时 ， 将 修改 记录 加 入 到 目标 
表 中 ， 它 的 主键 水 远 不 会 草 复 ， 而 是 作为 一 条 完整 的 、 狐 的 历史 记录 加 载 到 目标 表 中 )， 同 时 
























































加 载 过 程 中 也 应 该 具有 容 钳 的 能 力 ， 能 够 在 出 现 错误 的 时 候 不 影响 其 他 程序 的 执行 。 生 成 代 


理 键 的 过 程 如 图 12-5 所 示 。 


次 生成 代理 键 
[e Ew em 
图 12-4 转换 的 主要 功能 图 12-5 生成 代理 键 的 过 程 
(5) 元 数据 管理 
元 数据 管理 用 于 定义 ETL 流程 中 所 涉及 的 所 有 环节 ， 
如 图 12-6 所 示 。 元 数据 按照 用 途 可 以 分 为 技术 元 数据 和 业 
务 元 数据 。 技 术 元 数据 是 存储 数据 仓库 技术 细节 性 的 数据 ， 1r 


是 数据 仓库 开发 和 管理 所 使 用 的 数据 ， 主 要 包括 数据 仓库 的 o - o (me) 
模式 、 维 度 、 层 次 的 定义 。 业 务 元 数据 从 业务 角度 去 描述 数 


ES 
AJ) 
2 10002 | 资源 
部 门 

ES 























管理 
据 仓 库 的 信息 ， 是 数据 仓库 开发 人 员 和 业务 人 员 沟 通 的 桥 x 
染 ， 主 要 包括 企业 概念 模型 和 多 维 数据 模型 的 结构 和 定义 o 
元 数据 管理 也 是 数据 质量 管理 的 关键 。 
ETL 的 框架 结构 包含 了 业务 数据 源 、ODS 数据 缓冲 区 、 图 12-6 元 数据 管理 





ODS 统一 信息 视图 区 、 数 据 仓 库 (DW)、 数 据 集 市 (DM) 等 内 容 ， 如 图 12-7 所 示 。 


ETL 总 体 架构 


业务 数据 源 ODS 数 据 
缓冲 区 





图 12-7 ETL 的 框架 结构 


12.2 ”定义 ETL 的 流程 
(D. 从 源 数据 抽取 到 ODS 数据 缓冲 区 
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ODS 按 功能 可 以 划分 成 ODS 数据 缓冲 区 和 ODS 统一 信息 视图 区 .ODS 数据 缓冲 区 是 指 
数据 临时 存储 区 域 ， 它 基本 上 与 源 系统 的 数据 结构 保持 一 致 。ODS 统一 信息 视图 区 是 为 用 户 
提供 统一 的 企业 数据 视图 ， 它 的 数据 大 多 来 自 ODS 数据 缓冲 区 。 从 源 数据 抽取 到 ODS 数据 
缓冲 区 可 以 分 成 全 量 抽取 和 增 量 抽取 ， 如 图 12-8 所 示 。 全 量 抽取 是 将 源 数据 中 的 所 有 业务 数 
据 经 过 ETL 过 程 直接 抽取 到 ODS 数据 缓冲 区 中 ， 在 数据 传输 过 程 中 不 加 任何 的 过 滤 条 件 。 
全 量 抽取 一 般 发 生 在 第 一 次 对 ODS 数据 缓冲 区 进行 ETL 抽取 加 载 的 时 候 。 增 量 抽取 一 般 是 
根据 某 些 抽取 条 件 将 源 数 据 中 的 数据 抽取 到 ODS 数据 缓冲 区 中 , 抽取 条 件 可 以 是 按 着 时 间 进 
行 过 滤 ， 增 量 抽取 一 般 效 率 较 局 ， 不 占用 过 多 的 CPU 资源 。 

(2) 从 ODS 数据 绥 冲 区 抽取 到 ODS 统一 信息 视图 区 

数据 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 ， 一般 来 说 都 是 定时 抽取 的 ， 例 
如 按照 每 日 或 者 每 月 进行 抽取 ， 除 了 第 一 次 做 全 量 抽取 外 ， 其 余 时 间 都 是 做 增 量 抽 取 ， 可 
以 按照 某 种 更 新 策略 进行 抽取 ， 如 图 12-9 所 示 。 例 如 ， 按 照 时 间 惟 或 者 版 本 号 的 方式 进 
行 增 量 抽 取 。 

































Caa 
- ODS 
源 数 据 
经 过 ETL 过 程 
中 的 清洗 、 转 
换 、 加 载 并 且 
取 最 近 时 间 的 








源 数据 RES 
数据 缓冲 区 ODS 数据 缓冲 区 ODS 统一 信息 视图 区 


图 12-8 ”从 源 数据 抽取 到 ODS 数据 缓冲 区 图 12-9 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 


(3) 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 

数据 仓库 是 根据 业务 的 需求 ， 对 企业 数据 进行 整合 ， 同 时 又 是 存储 历史 数据 的 地 方 。 它 
覆 盖 了 多 个 主题 域 的 组 成 ， 这 些 信息 有 可 能 是 粒度 级 别 低 、 高 细节 的 数据 ， 也 可 能 是 按照 某 
种 业务 需求 建立 起 来 的 轻 度 汇总 数据 ， 它 们 通常 按 照 一 定 的 时 间 频 率 进 行 定期 的 刷新 ， 为 数 
据 集 市 提供 高 质量 的 数据 。 数 据 仓 库 偶 重 于 数据 的 存储 与 整合 ， 通 香 需 要 建立 轻 量 级 的 索引 。 
数据 从 ODS 统 一 信息 视图 区 抽取 到 数据 仓库 ,一 般 来 说 除了 第 一 次 加 载 数据 时 用 全 量 抽取 外 ， 
其 余 时 间 都 是 做 增 量 抽取 ， 这 样 可 以 降低 CPU 资源 的 消耗 ， 如 图 12-10 所 示 。 例 如 ， 可 以 按 
照 时 间 惟 或 者 版 本 号 的 方式 进行 增 量 抽取 。 

(4). 从 数据 仓库 抽取 到 数据 集 市 

数据 集 市 是 针对 某 个 主题 域 、 部 门 或 者 特定 用 户 的 数据 集合 。 数 据 集 市 中 的 数据 是 商业 
智能 报表 展现 的 数据 来 源 ， 它 需要 对 用 户 的 快速 访问 进行 优化 ， 优 化 的 方式 可 以 是 汇总 和 建 
立 索 引 。 数 据 集 市 的 作用 是 保障 数据 仓库 的 高 性 能 、 可 扩展 性 和 可 用 性 。 从 数据 仓库 抽取 到 
数据 集 市 是 根据 业务 需求 来 判断 是 否 通过 增 量 或 者 全 量 的 方式 进行 抽取 ， 然 后 通过 计算 或 者 
汇总 的 方式 加 载 到 数据 集 市 中 ， 如 图 12-11 所 示 。 
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ODS 统一 信息 视图 区 数据 仓库 数据 仓库 数据 集 市 
图 12-10 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 图 12-11 从 数据 仓库 抽取 到 数据 集 市 
总 结 : ETL 的 流程 包含 了 从 源 数据 抽取 到 ODS 数据 缓冲 区 、 从 ODS 数据 缓冲 区 抽取 到 
ODS 统一 信息 视图 区 、 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 、 从 数据 仓库 抽取 到 数据 集 
市 的 过 程 ， 如 图 12-12 所 示 。 这 些 过 程 涉及 数据 的 映射 、ETL 逻辑 的 设计 、ETL 调度 的 设计 、 
模块 的 整合 和 流程 的 测试 、ETL 程序 的 编写 等 内 容 。 


E 从 源 数据 抽取 到 ODS 数据 缓冲 区 E 








n 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 " 


从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 


m 从 数据 仓库 抽取 到 数据 集 市 x 





图 12-12 ETL 的 流程 
12.3 ETL 的 加 载 方法 


12.3.4 以 时 间 戳 作为 加 载 条 件 


利用 时 间 惟 的 方式 对 目标 表 进行 数据 加 载 是 相对 简单 的 一 种 方法 。 可 以 利用 业务 源 数 据 
表 已 有 的 时 间 罕 段 ， 或 者 添加 一 个 时 间 字 段 作 为 时 间 惟 ， 当 业务 数据 表 里 的 数据 修改 或 者 添 
加 时 ， 同 时 也 会 修改 或 者 添加 时 间 字 段 里 的 值 ， 可 以 通过 系统 时 间 与 源 数 据 表 中 的 时 间 罕 段 
进行 比较 ， 来 判断 该 记录 是 人 否 应 该 加 载 到 目标 表 中 。 这 种 以 时 间 惟 作为 数据 加 载 条 件 的 优点 
是 使 ETL 设计 简单 清晰 ， 抽取 的 效率 相对 较 高 ， 并 且 可 以 实现 ETL 数据 加 载 的 需求 ; 缺点 是 
需要 对 业务 源 数据 的 时 间 惟 进行 维护 。 

PAEH Informatica 工具 ， 用 时 间 惟 的 方式 进行 数据 加 载 。 
(1) 设计 源 表 和 目标 表 








































源 表 如 图 12-13 所 示 。 其 中 ID 是 主键 ， YEAR. MON 是 时 间 鹤 。 
-本 本 号 
DREES l 






za 
number 15 E] 
AME varchar? 40 | 
EAR varchar? 40 
varchar? 






图 12-13 JKR 
目标 表 如 图 12-14 所 示 。 其 中 D 是 主键 。 
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TARGET LOracle) 
P Target Definition 





12-14 Hh 
(2) 设计 Mapping 
Mapping 的 设计 如 图 12-15 所 示 : 它 的 抽取 频率 被 设置 成 每 月 抽取 一 次 。 


= 


5 0 URCE LioOracl S0 SOURCE FILTRAHS LEPTRAHS UPDTRAHS TARGET tOracl 
ae] ej 





12-15 Mapping 设计 (一 ) 
Mapping 展开 后 如 图 12-16 所 示 。 


mms SOURCE (üracle] AF 
—' Source Definition 


==] 


n 


doble f 
string [ 
string [ 
pee] 





12-16 Mapping 设计 (二) 
(3) 组件 的 设计 
FILTRANS( 过 滤器 ) 组 件 设计 如 图 12-17 所 示 。 


F FILTRANHS 
Bn Filter 


m~ 


+| NAME string 加 —  |* 


t| YEAR trins Mo 
pro E 





12-17 FILTRANS 组 件 设计 
FILTRANS 过 滤 方 法 是 判断 源 表 的 时 间 惟 YEAR. MON 字段 是 否 等 于 ETL 服务 器 的 系 
统 时 间 ， 或 者 时 间 惟 YEAR. MON 字段 等 于 固定 的 数值 。 
FILTRANS 的 代码 如 图 12-18 所 示 。 
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lll Expression Editor: <name> - FILTRANS (Filter) 


Functions | Ports | Variables | Formula dà | "| E $ 





-O All Functions 
-DD Character 

-O Conversion 
-DJ Data Cleansing 
-0 Date 

-CJ Humerical 

LJ Scientific 

LJ Special 

-D Test 

-O Variables 

-C Lookups 
















(sysdate, mn )-to char (MON) 





H-H -图 图” 图- 用 -图 图- 图 图 








Aj spe] 
papas 


WES 


Functions in the All ki 








Ito char (sysdate, yyyy )-to char(YEAR) and to char ê 










12-18 FILTRANS (过 滤器 ) 代码 


Lookup 组 件 设计 如 图 12-19 所 示 。 


pm LKPTRANS 
O Lookup Procedure 


YEAR SRC 
MONT SRC 
ID SRC 

NAME SRC 


PP EEE EEE EEE EEE E E E E i E 


12-19 Lookup 组 件 设 计 
Lookup 组 件 的 查询 条 件 如 图 12-20 所 示 。 


Edit Transformations 





Transformation | Forts | Froperties Condition | Metadata Extensions | 





Select E rtt 


Transformation [Lookup Procedure i 


Lookup Table Column Operator Transformation Port 





12-20 Lookup 组 件 的 查询 条 件 


Update 组 件 设 计 如 图 12-21 所 示 。 
UPOTRANS 


E Update Strategy 














double 


MAME string 4t] 
ID SRC double 15 
MAME SR string 40 


12-21 Update 组件 设计 
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Update 组 件 的 过 小 代码 如 图 12-22 所 示 。 


| TT Strategy) 









- C All Functions 
由 Em Character 





-LJ Conversion M. 

由 加 Data Cleansing iif((ID !- ID SRC 
&- LL Date or 

HLI Numerical NAME !- NAME SRC ), 
m-i Scientific dd_update, dd_reject 
+ C Special ) ) 

g- LL Test 

kC Variables 

&--L Lookups 





Functions in the All zi Numeric keypad— ;-Üperator keypad 
UP..- = 上- -一 -一 Re | 




















图 12-22 Update 组 件 的 过 滤 代 码 





(4) 源 表 到 目标 表 的 映射 
假设 当前 ETL 服务 器 的 系统 时 间 为 2011 年 1 月 31 日 ， 源 表 的 数据 见 表 12-1. 


表 12-1 源 表 的 数据 


| [0-0 | 
| 
| 


以 时 间 鹤 作为 加 载 条 件 ， 经 过 ETL 抽取 之 后 目标 表 的 数据 见 表 12-2. 
表 12-2 目标 表 的 数据 


ID NAME 
1 Hi 

2 s 

3 内 


源 表 修改 后 的 数据 见 表 12-3。 
表 12-3 源 表 修改 后 的 数据 
| 
2 | 
| 
再 经 过 ETL 数据 抽取 之 后 ， 目 标 表 的 数据 见 表 12-4. 
表 12-4 目标 表 的 新 数据 


ID NAME 
l is 

2 乙 

3 $ 
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12.3.2 ”利用 源 表 的 日 志 信 息 对 目标 表 进 行 数据 加 载 


在 业务 系统 中 为 源 表 添 加 日 意 表 ， 当 源 表 中 的 数据 增加 、 删 除 、 修 改 时 ， 及 时 更 新 该 源 
表 的 日 志 表 。 在 进行 ETL 数据 加 载 时 ， 通 过 读 取 源 表 的 日 志 信 息 决 定 为 目标 表 加 载 哪 些 源 表 
的 数据 。 优 点 是 不 需要 更 改 数据 源 表 的 表 绪 构 和 数据 ， 降 低 了 数据 加 载 的 风险 。 缺 点 是 需要 
维护 日 志 表 的 数据 ， 增 加 了 系统 的 开销 。 更 狐 日 忘 表 的 方式 可 以 通过 触 友 占 对 日 志 表 的 信息 
进行 修改 ， 如 图 12-23 所 示 。 




















i 





ETL% Co 人 
数据 源 表 O> ES 


图 12-23 利用 源 表 的 日 志 信 息 对 目标 表 进行 数据 加 载 














12.3.3 ”通过 全 表 对 比 的 方式 进行 数据 加 载 


通过 全 表 对 比 的 方式 进行 数据 加 载 ， 是 对 目标 表 的 每 条 数据 进行 比较 ， 当 目标 表 不 存在 
该 主键 值 时 ， 进 行 插入 操作 ， 如 果 该 主键 值 已 经 存在 ， 则 需要 对 其 余 字 段 进 行 比较 ， 如 果 有 
不 相同 的 数值 ， 则 需要 进行 更 新 操作 。 全 表 对 比 的 方式 不 需要 对 业务 源 数 据 表 进行 任何 修改 ， 
安全 性 较 高 ， 但 是 由 于 流程 较为 复 多 ， 一 般 抽 取 的 效率 较 低 。 

下 面 利 用 Informatica 工具 ， 通 过 全 表 对 比 的 方式 进行 数据 加 载 。 

(1) 设计 源 表 和 目标 表 

源 表 如 图 12-24 所 示 。 其 中 ID 是 主键 ，YEAR、MON HT EJER. 

目标 表 如 图 12-25 所 示 。 其 中 ID 是 主键 。 























| TARGET tOracle) 
a Tarwet Def inition 


ini i nn 
Datatype | ERR 


number number 15 
varchar? varcharz 4t) 
varchar? 
varcharz 





图 12-24 JK 图 12-25 目标 表 


(2) 设计 Mapping 
Mapping 的 设计 如 图 12-26 Drs: EKIRAR i EL BRE H IU IX e 
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p V » 


SOURCE LOracl SH SOURCE LEPTRANS UPOTRANS TARGET NITET. 


-» el] 





12-26 Mapping 设计 (一) 
Mapping 展开 后 如 图 12-27 所 示 。 


mn SOURCE COracle) I? I- 5B SOURCE HAP EE LEPETRANS 
| Source Definition Source Mualifier 3. Lookup Frocedure 


€IID number 

|— | NAME NAME 

| | YEAR ID SOURCE 
NAME SOURCE 


MN o — 
C E — YEAR SOUREE 


MLIN, LILIR; f 





12-27 Mapping il (Z) 


(3) 组 件 的 设计 
Lookup 组 件 设计 如 图 12-28 所 示 。 


" t LEPTRAHS ERES 
3. Lookup Pracedure 


Mane | Datatype |L.. L... 
| NAME string 40 Yes 
|. ID SOURCE double 16 No 
| NAME SOURCE string 40 No 
| YEAR SDURCE — string 40 No |* 
| MUN SOURCE — strinz — — 4ü Mo | 
o | | | 


xe 





图 12-28 Lookup 组 件 设计 
Lookup 组 件 的 查询 条 件 如 图 12-29 Brzn 


Edit Transformations 


dum m T 


| Lookup Table Column | Üperator | Transformation Fort 
mm o [mem 


[RF OCT 


图 12-29 Lookup 组 件 的 查询 条 件 
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Update 组 件 设计 如 图 12-30 所 示 。 


- ,Porras 
| Update Strategy 


double 
MAME string 
ID SOURCE double 
WAME SOURCE string 
YEAR SOURCE string 
MOM SOURCE string 





图 12-30 Update 组 件 设计 
Update 组 件 的 过 小 代码 如 图 12-31 PTR. 


| Expression Editor: <name> - UPDTRANS (Update Strategy) xÍ 

Functions | Ports | Variables | pol dà | | en 部 A x 
-LI All Functions iif(isnull(ID),dd insert,iif(ID!-ID SOURCE or NAME! Æ 
由 Character -NANE SOURCE, dd, update, dd  reject)) 


由 -DD Conversion 















+ r Numeric keypad Üperator keypad 


Functions in the All 


BP- -i 一 ---- 























图 12-31 Update 组 件 的 过 滤 代 码 





(4) 源 表 到 目标 表 的 映射 
假设 当前 ETL 服务 器 的 系统 时 间 为 2011 年 1 月 31 日 ， 源 表 的 数据 见 表 12-5. 


表 12-5 源 表 的 数据 


| K= | 
> tm | 
| 


通过 全 表 对 比 的 方式 进行 数据 加 载 ， 经 过 ETL 抽取 之 后 目标 表 的 数据 见 表 12-6。 


X 12-6 目标 表 的 数据 


ID NAME 
1 ems 
2 2E 
3 XH 


修改 源 表 的 数据 ， 见 表 12-7. 
表 12-7 源 表 修 改 后 的 数据 


| | 
> | 
| 
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再 经 过 ETL 数据 抽取 之 后 ， 目 标 表 的 数据 见 表 12-8。 
表 12-8 目标 表 的 新 数据 


ID NAME 
1 Xl 
2 zÆ py 

Eh 


12.3.4 ”全 表 删 除 后 出 进行 数据 加 载 的 方式 
全 表 删 除 后 再 进行 数据 加 载 的 方式 的 实现 相对 简单。 但 是 不 能 实现 数据 的 递增 加 载 ， 只 
能 删除 目标 表 的 数据 之 后 ， 再 经 过 ETL 为 目标 表 加 载 数据 ，Informatica 工具 提供 了 这 样 的 一 
种 功能 , 在 WorkFlow 的 Session 中 议定 Attribute( 属 性 定义 ), 再 选择 Truncate target table option 

即 可 ， 如 图 12-32 所 示 。 
二 


General | Properties | Config Object Mapping | Components | Metadata Extensions | 





























































RE Truncate target table option 


取消 | mmo | s | 
图 12-32 iX Attribute 


总 结 : ETL 的 加 载 方法 包括 全 量 加 载 和 增 量 加 载 ， 如 图 12-33 Har. MARAR EH, 
全 量 加 载 的 方式 比 增 量 加 载 要 简单 很 多 ， 使 用 增 量 加 载 的 方法 ， 难 度 在 于 必须 设计 正确 有 效 
的 方法 从 数据 源 中 抽取 变化 的 数据 ， 同 时 将 这 些 变化 的 数据 更 新 到 数据 仓库 中 ， 如 采 每 次 抽 
取 都 有 超过 1/4 的 业务 源 数据 需要 更 新 ， 就 应 该 考虑 更 改 ETL 的 加 载 方 法 ， 由 增 量 抽取 改 为 


全 量 抽取 。 全 量 抽取 对 于 数据 量 较 小 ， 更 新 频率 较 低 的 系统 比较 适用 。 

















。 以 时 间 蕉 作为 加 载 e 全 表 删 除 后 再 进行 
的 条 件 数据 加 载 的 方式 
« 利用 源 表 的 日 志 信 


息 对 目标 表 进 行 数 
据 加 载 

。 通 过 全 表 对 比 的 方 
式 进 行 数 据 加 载 





图 12-33 ETL 的 加 载 方 法 
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12.4 利用 ETL 构 建 企 业 级 效 据 仓库 





1) 在 构建 数据 仓库 系统 的 时 候 ， 通 各 的 做 法 是 将 业务 系统 部 普 在 一 合 服务 右 中 ， 而 数据 
仓库 系统 部 署 在 另外 一 台 服 务 器 中 ， 如 网 12-34 所 示 。 考 虑 到 数据 仓库 系统 需要 从 业务 系统 
中 不 断 访问 数据 ， 而 且 数 据 量 较 大 ， 所 以 需要 在 数据 仓库 系统 和 业务 系统 之 间 建 立 一 个 数据 
绥 存 区 ， 如 网 12-35 所 示 。 通 过 ETL 先 将 业务 系统 中 的 数据 抽取 到 数据 绥 存 区 中 ， 然 后 再 对 
数据 缓存 区 的 数据 进行 处 理 ， 这 样 就 可 以 避免 数据 仓库 系统 频 埃 地 访问 业务 系统 ， 防 止 在 业 
务 系 统 中 进行 大 量 的 整合 、 计 算 等 工作 ， 降 低 了 对 业务 系统 性 能 的 有 影响。 数据 抽取 的 频 京 可 
以 是 每 天 或 者 每 月 ， 因 为 数据 缓存 区 域 上 只 保存 当前 的 实时 数据 ， 数 据 量 相对 较 小 ， 在 数据 组 
存 区 中 进行 转换 、 清 洗 、 整 合 的 操作 ， 效 率 相 对 较 局 ， 这 样 不仅 近 局 了 数据 仓库 系统 的 整体 
性 能 ， 同 时 也 保证 了 数据 的 一 致 性 。 



















































TEES 
务 
Hi 
数据 仓库 
图 12-34 ”数据 仓库 直接 访问 数据 源 
IT — 
. EE B i Ww. 
ll a = 抽取 s ~ : 整合 、 计 算 
务 e | z iB 
A . = | 
udi / 数据 源 : 
tI 
D g 数据 仓库 
I 数据 缓存 区 数据 仓库 





图 12-35 ”建立 数据 缓存 区 


2) 构建 企业 数据 仓库 需要 充分 发 挥 时 间 崔 的 作用 。 在 ETL HEr, WEIEN EREN 
抽取 的 标识 ， 例 如 从 业务 系统 中 抽取 每 天 的 数据 ， 束 可 以 使 用 时 间 鹤 作为 抽取 的 条 件 。 

3) 在 构建 企业 数据 仓库 时 ， 可 以 使 用 ETL 过 程 中 产生 的 日 志 信 息 去 查看 数据 处 理 的 情 
况 ， 日 忘 一 般 记录 了 ETL 过 程 中 产生 的 详细 信息 ， 包 括 数 据 抽 取 成 功 的 次 数 和 记录 数 ， 数 据 
抽取 失败 的 次 数 和 记录 数 等 内 容 。 可 以 根据 日 志 信 息 对 构建 企业 数据 仓库 过 程 中 产生 的 问题 
进行 修改 和 调整 。 
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12.5 ETL 的 设计 过 程 


(1) 数据 源 和 ODS 之 间 的 对 应 





需要 记录 源 数据 和 目标 数据 的 数据 库 类 型 、 服 务 器 卫 、 数 据 库 名 称 、 用 户 名 和 密码 。 


在 进行 ETL 设计 时 ， 需 要 设 定 抽 取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 
ODS 设计 见 表 12-9. 
表 12-9 ODS 设计 


抽取 周期 月 
抽取 条 件 第 一 次 做 全 量 抽取 ， 后 面 只 抽取 前 一 月 的 数据 





数据 源 和 ODS 之 间 的 对 应 见 表 12-10. 
表 12-10 数据 源 和 ODS 之 间 的 对 应 


目标 字段 
EPRI 
行业 类 型 编码 转换 规则 参照 行业 类 型 编码 表 
地 区 编码 转换 规则 参照 地 区 类 型 编码 表 
购买 时 间 
购买 商品 数量 参照 源 表 进行 汇总 相 加 


(2) ODS 和 数据 仓库 之 间 的 对 应 








备 





VE 


需要 记录 源 数据 和 目标 数据 的 数据 库 类 型 、 服 务 器 一 、 数 据 库 名 称 、 用 户 名 和 密码 。 


在 进行 ETL 设计 时 ， 需 要 设 定 抽取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 
数据 仓库 设计 见 表 12-11。 
表 12-11 数据 仓库 设计 


抽取 周期 H 
抽取 条 件 全 部 





ODS 和 数据 仓库 之 间 的 对 应 见 表 12-12. 
表 12-12 ODS 和 数据 仓库 之 间 的 对 应 


EX: 
BP | CUSTCODE | CUSTCODE | weed | | 
Hw. | TRADED | TRADED | vao | ——— 
Ww) | smucr | DISTRICT | vehe) | — | 
wxwm | BOvDATE | BOYDATE | DAE O 
H | wom | | vemo | SJ 
wi | vw — | — — | veeo | ar 和 OH 
ET mis | va | ———— — 


(3) 数据 仓库 和 效 据 集 市 乙 间 的 对 应 





需要 记录 源 数据 和 目标 数据 的 数据 库 类 型 、 服 务 器 一、 数据 库 名 称 、 用 户 名 和 密码 。 


在 进行 ETL 设计 时 ， 需 要 设 定 抽取 的 周期 、 抽 取 的 字段 和 抽取 的 条 件 等 。 
其 中 事实 表 的 设计 见 表 12-13. 
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主题 搞 述 : 按时 间 、 地 区 、 行 业 、 统 计 客 户 购 买 商 品 的 信息 进行 搞 述 ， 并 且 进 行 同 期 比 
较 《〈 例 如 对 2011 Æ 1 HA 2010 Æ 1 月 进行 对 比 )。 
表 12-13 事实 表 的 设计 


HW T B 备注 
EPA | CUSTCODE | CUSTCODE | vaca | — O O O O  oOoOoOoO 
TR | TRADED | TRADED | vate | | 
UKN | DISTRICT | DISTRICT | va | | 

购买 时 间 | BUYDATE | BUYDATE | DAE | | 

年 份 

nf 来 自 数据 仓库 源 表 中 的 月 份 

购买 商品 数量 | BUYSUM | 需要 计算 | Vaeha2O0 | | 


地 区 维 表 见 表 12-14. 
表 12-14 地 区 维 表 


抽取 周期 月 
抽取 条 件 全 部 


地 区 维 表 的 设计 见 表 12-15. 
表 12-15 地 区 维 表 的 设计 


TER & 3 
GR 
MICE 
UKAN 


行业 类 列 维 表 见 表 12-16. 
表 12-16 行业 类 别 维 表 


抽取 周期 H 
抽取 条 件 全 部 


行业 维 表 的 设计 见 表 12-17。 
表 12-17 行业 维 表 的 设计 


THE CNET 
ERR 
iria 
XL VAR 


12.06 ETL 的 备份 与 恢复 


12.6.1 数据 的 备份 


1. ODS 数据 的 备份 
SA ODS 采用 的 是 Oracle 数据 库 ， 它 的 备份 设计 如 下 : 
1) 可 以 采用 全 量 备份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数据 进行 备份 。 备 份 的 
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周期 可 以 根据 需要 灵活 变动 ， 一 般 是 每 周 进行 一 次 备份 ， 保 留 一 个 月 左右 的 备份 数据 。 

2) 可 以 采用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 六 增 量 文件 进行 备份 。 通 第 需要 保留 近 两 
个 月 的 备份 数据 。 

2. 数据 仓库 的 数据 备份 

默认 数据 仓库 采用 的 是 Oracle 数据 库 ， 它 的 备份 设计 如 下 : 

1) 可 以 采用 全 量 备份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数据 进行 备份 。 由 于 数 
据 仓 库 数 据 量 巨 大 ， 可 以 2 一 3 周 进行 一 次 全 量 备 份 ， 通 第 保存 一 个 月 左右 的 备份 数据 。 

2) 可 以 采用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 六 增 量 文件 进行 备份 。 通 第 保存 近 两 个 月 
的 备份 数据 。 

3. 数据 集 市 的 数据 备份 

默认 数据 集 市 的 数据 存放 到 Oracle 数据 库 中 ， 多 维 数 据 采 用 Cognos OLAP AR. 

D 对 于 数据 集 市 数据 可 以 采用 全 量 备份 的 形式 ， 使 用 Oracle 的 导出 工具 ， 全 库 导 出 数据 
进行 备份 。 通 种 保存 一 个 月 左右 的 备份 数据 。 如 果 采 用 增 量 备份 的 形式 ， 导 出 Oracle 的 日 志 
增 量 文件 进行 备份 ， 通 党 保存 近 两 个 月 的 备份 数据 。 

2) 因为 Cognos OLAP 模型 存放 在 固定 路 作文 件 夹 下 ， 并 没有 太 多 的 数据 量 ， 每 天 进行 
全 量 备 份 即 可 。 


12.6.2 ”数据 备份 存放 的 介质 以 及 目录 结 


1) ODS 数据 全 量 可 以 备份 到 磁带 库 或 者 是 RAD 阵列 介质 上 ， 然 后 在 介质 上 建立 两 个 
文件 来， 例如 /back/ods/beifen1、/back/ods/beifen2， 保 留 两 次 最 近 的 全 量 备 份 。 

2) ODS 数据 增 量 可 以 备份 到 RAID 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/ods/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

3) 数据 仓库 数据 全 量 可 以 备份 到 人 厂 市 库 或 者 是 RAID 阵列 介质 上 ,然后 在 介质 上 建立 两 
个 文件 夹 ， 例 如 /back/dw/beifen1、/back/dw/beifen2， 保 留 两 次 最 近 的 全 量 备 份 。 

4) 数据 仓库 数据 增 量 可 以 备份 到 RAD 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/dw/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

5) 数据 集 市 数据 全 量 可 以 备份 到 人 磁 市 库 或 者 是 RAD 阵列 介质 上 ,然后 在 介质 上 建立 两 
个 文件 夹 ， 例 如 /back/dm/beifen1、/back/dm/beifen2， 保 留 两 次 最 近 的 全 量 备份 。 

6) 数据 集 市 数据 增 量 可 以 备份 到 RAID 阵列 介质 上 ， 然 后 在 介质 上 建立 文件 夹 ， 例 如 
/back/dm/ increment， 将 增 量 文件 保存 到 该 目录 下 。 

7) 多 维 OLAP 模型 可 以 存储 到 RAID 阵列 介质 上 上， 建立 多 个 文件 夹 以 保存 最 近 的 备份 。 

8) AMIRE CR Cognos 知识 库 、ETL 知识 库 、 应 用 程序 知识 库 ) 可 以 备份 到 RAID EE 
列 介质 上 。 一 般 采 取 的 方式 是 全 量 备份 ， 将 不 同 的 知识 库 保 存 到 不 同 的 目录 下 。 


12.6.3 ETL 程序 的 备份 


默认 ETL 工具 是 PowerCenter，ETL 程序 的 备份 包括 开发 人 员 编写 的 程序 代码 〈 包 括 从 
业务 系统 到 ODS 数据 缓冲 区 的 ETL 程序 ,从 ODS 数据 缓冲 区 到 ODS 统一 信息 视图 区 的 ETL 
程序 , 从 ODS 统一 信息 视图 区 到 数据 仓库 的 ETL 程序 , 从 数据 仓库 到 数据 集 市 的 ETL 程序 )， 
各 种 参数 的 配置 ，ETL 工具 的 软件 等 。 
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12.6.4 ”数据 的 恢复 方案 
CD 操作 系统 的 恢复 〈 见 图 12-36) 








ODS 服务 器 
操作 系统 











EPRA 
统 ， 根 据 配 
置信 息 配 置 
系统 










Cognos 服务 
器 操作 系统 


数据 仓库 服务 
S ERE IR ER 





PowerCenter 
ETL JR oS 28 
操作 系统 
图 12-36 操作 系统 的 恢复 


(2) ODS 数据 的 恢复 〈 见 图 12-37) 




















ODS 
统一 信息 


视图 区 


ODS 
统一 信息 


视图 区 





当 部 分 数据 表 丢 失 
时 ， 可 以 从 全 量 

份 中 导入 数据 ， 然 
后 再 恢复 全 量 备份 
时 刻 到 最 新 时 刻 的 
增 量 数 据 








当 数据 库 系 统 彻底 
animh, "TARH 
全 量 备份 恢复 数据 
库 系 统 






ODS 数据 
缓冲 区 





a) b) 
图 12-37 ODS 数据 的 恢复 
a) ODS 数据 的 恢复 方法 (一) b) ODS 数据 的 恢复 方法 C» 


(3) 数据 仓库 和 数据 集 市 的 恢复 ILA] 12-38) 




















数据 仓库 数据 仓库 
当 部 分 数据 表 丢 失 
当 数 据 库 系统 彻底 时 ， 可 以 从 全 量 备 
EE 崩溃 时 ， 可 以 采用 Bu 份 中 导入 数据 ， 然 
全 量 备 份 恢复 数据 后 再 恢复 全 量 备份 
库 系统 时 刻 到 最 新 时 刻 的 
数据 集 市 数据 集 市 TENE 
a) b) 


图 12-38 ”数据 仓库 和 数据 集 市 的 恢复 
a) 数据 仓库 和 数据 集 市 的 恢复 方法 一 b) 数据 仓库 和 数据 集 市 的 恢复 方法 二 
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(4) 知识 库 的 恢复 CILE] 12-39) 







Cognos 知识 库 
的 恢复 


PowerCenter 
知识 库 的 恢复 















j 
R 







使 用 全 量 备份 
恢复 所 有 的 数 
据 表 ,并且 补 


图 12-39 ”知识 库 的 恢复 





(5) Cognos OLAP 模型 和 运行 程序 、 运 行 数 据 的 恢复 〈 见 图 12-40) 







运行 程序 、 运 行 
数据 的 恢复 





Cognos OLAP 
模型 的 恢复 

















使 用 全 量 备份 MY > 
对 数据 进行 恢 
复 ， 使 用 文件 
夹 下 的 模型 文 
件 对 OLAP 

模型 进行 恢复 





K|12-40 Cognos OLAP 模型 和 运行 程序 、 运 行 数 据 的 恢复 
12.7 ETL 数据 质量 的 改进 


12.7.4 ” ETL 数据 质量 分 析 


因为 传统 的 业务 系统 多 以 内 部 上 自 号 的 需求 为 文 撑 点 ， 进 行 相 对 独立 的 设计 和 开发 ， 而 缺 
少 对 企业 整体 情况 的 考虑 ， 在 企业 内 部 信息 中 形成 了 许多 信息 和 孤岛。 所 谓 信息 了 天 岛 ， 是 指 信 
县 之 间 不 共享 ， 信 息 与 业务 流程 之 间 相 互 肪 离 ， 好 像 海 洋 当中 的 一 个 个 的 扳 岛 ， 不 能 满足 信 
县 之 间 共 享 的 需求 ， 主 要 体现 在 : 

D 不 同 的 业务 系统 中 存在 数据 不 一 致 的 现象 ,例如 人 力 资 源 系 统 中 的 公司 员工 信息 和 财 
务 系统 中 的 公司 员工 信息 不 一 致 。 

2) 数据 杂乱 、 分 散 ， 在 同一 系统 中 出 现 系 统 数 据 和 人 工 处 理 的 数据 并 存 的 现象 。 

3) 数据 格式 不 统一 ， 相 同 数据 存在 多 样 性 的 特点 。 

4) 数据 信息 存在 严重 缺失 、 不 完整 的 现象 。 

ETL 数据 质量 改进 的 困难 体现 在 : 

D 数据 量 较 大 ， 数 据 类 型 不 统一 。 

2) 数据 质量 没有 一 个 清晰 明确 的 标准 和 定义 。 

3) 系统 的 改造 和 升级 或 者 是 人 为 因素 ， 都 可 能 导致 数据 的 混乱 。 

绽 合 以 上 几 种 情况 ， 在 进行 ETL 数据 质量 分 析 时 ， 需 要 不 断 进行 修正 ， 尽 量 使 该 系统 的 
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Zim 3 3p AE A SAL YGRU ES S T ARAE HEBES 77 33 25 2E 2 LETS] n DEGREE RE — tE, BR 
此 以 外 ， 还 需要 过 滤 系 统 的 垃圾 数据 ， 建立 人 工 映 射 表 去 统一 和 匹配 编码 不 一 致 的 部 分 数据 。 


12.7.2 ETL 数据 质量 改进 的 方法 和 目标 


ETL 数据 质量 主要 从 技术 层面 、 管 理 层面 、 业 务 层面 等 角度 去 分 析 和 改进 。 

10 从 技术 层面 来 说 ， 需 要 对 源 数 据 进 行 清洗 ， 以 过 小 挥 垃圾 数据 和 存在 不 一 致 性 的 数 
据 ， 同 时 需要 对 源 数据 的 质量 进行 评 佑 ， 然 后 根据 业务 实际 情况 设计 出 完整 的 数据 质量 改 
进 方案 。 

2) 从 管理 层面 来 说 ， 应 该 切实 保证 从 业务 系统 源 数据 到 数据 集 市 中 各 个 环节 的 数据 的 正 
确 性 、 一 致 性 和 完整 性 。 

3) 从 业务 层面 来 说 ， 对 源 数据 的 抽取 需要 遵循 相应 的 业务 规则 ， 将 ETL 的 过 程 流程 化 、 
规范 化 。 

ETL 数据 质量 的 目标 分 为 以 下 几 个 部 分 : 

1) 完善 企业 各 个 部 门 之 间 信 息 数 据 的 共享 ， 消 除 信息 孤岛 的 现象 。 

2) 对 现 有 的 数据 进行 标准 化 和 规范 化 。 

3) 规范 ETL 设计 和 开发 的 流程 ， 实 现 对 每 个 流程 的 监督 。 

4) 制定 相应 的 数据 质量 标准 。 


12.7.3 ”推动 ETL 数 据 质 量 改进 的 方法 


推动 ETL 数据 质量 的 改进 ， 关 键 是 管理 层 、 领 导 层 的 重视 ， 能 够 保证 有 效 的 资源 投入 ， 
让 企业 各 个 级 别 的 部 门 都 重视 数据 质量 的 问题 。 同 时 配 有 相应 的 监督 措施 ， 通 过 分 步骤 实施 、 
不 断 完 善 的 原则 奉 找 每 个 分 析 主 题 中 数据 质量 的 缺陷 ， 检 奋 从 业务 生产 系统 到 数据 仓库 、 数 
据 集 市 中 各 个 环节 的 计算 方法 和 转换 步 又 ， 检 碍 每 一 个 环节 和 流程 是 合 正 确 ， 层 层 推 进 ， 从 
而 保证 ETL 数据 质量 的 提高 和 改进 。 












































12.8 ETLE HAZMI 


12.8.1 ETLER 


ETL 分 析 需 求 见 表 12-18. 

需求 目的 : 按照 时 间 、 地 区 、 商 品类 列 、 客 户 类 别 等 维度 对 客户 数 、 销 售 数量 进行 同比 、 
环比 分 析 。 

维度 层次 结构 : 包括 时 间 、 地 区 、 商 品类 别 和 客户 类 别 。 

e 时 间 : 年 - 季 - 月 。 

e 地 区 : 北京 、 上 海 、 广 州 、 深 圳 。 

e 商品 类 别 : 家 电 类 、 电 子 类 、 服 装 类 、 食 品类 。 

e 客户 类 别 : VIP 客户、 注册 客户 、 普 通 客 户 。 

数据 源 : 客户 购买 商品 基本 信息 表 。 

粒度 : 按 月 统计 细节 数据 。 
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表 12-18 “分析 需求 


主题 分 析 客户 购买 商品 情况 
需求 目的 按照 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 等 维度 对 客户 数 、 销 售 数量 进行 同比 、 环 比分 析 
维度 时 间 、 地 区 、 商 品类 别 、 客 户 类 别 


时 间 : 年 -季度 -月 
地 区 : 北京 、 上 海 、 广 州 、 深 圳 





维度 层次 结构 TE: L— = l 
商品 类 别 : 家 电 类 、 电子 类 、 服装 类 、 食品 类 
客户 类 别 : VIP 客户 、 注 册 客 户 、 普 通 客户 
分 析 指 标 客户 数 、 销 售 数量 进行 同比 、 环 比分 析 
数据 来 源 企业 销售 系统 
V" 公司 决策 领导 人 员 中 层 管理 人 员 商品 销售 人 员 
关注 人 员 m TUS cmm 
关注 关注 关注 


12.8.2 ETL 数据 源 说 明 
客户 购买 商品 基本 信息 表 《〈 数 据 源 表 ) Jide 12-19. 


412-19 客户 购买 商品 基本 信息 表 











名 W Null( 是 否 为 空 ) 描述 
Phone number 电话 号 但 
Cust Type Code 客户 类 别 编码 
Goods Code 购买 商品 类 别 编码 
Goods Num 购买 商品 的 数量 


12.8.3 ODS 设计 与 抽取 


1. ODS 编码 说 明 
地 区 编码 表 见 表 12-20. 





表 12-20 地 区 编码 表 


编 W 名 称 ETL 转换 说 明 ( 源 系统 的 编码 ) 
北京 001 
102 上 海 002 
广州 003 
104 深圳 004 


天 一 m 
© © 
(09) -一 








商品 类 别 编码 表 见 表 12-21. 
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表 12-21 商品 类 别 编码 表 


商品 类 别 编码 ETL 转换 说 明 ( 源 系 统 的 编码 ) 
012 21 


客户 头 别 编码 表 见 表 12-22. 
表 12-22 ”客户 类 别 编码 表 
类 别 编码 ETL 转换 说 明 ( 源 系统 的 编码 ) 
2. ODS 表 结 构 说 明 
ODS 表 结 构 说 明 见 表 12-23. 
表 12-23 ODS 表 结 构 说 明 


名 称 Null 73955) i 








Cust Code ATEN 
Add Code DIE 
Cus Type Coe DOTT 


GoodsTypc L— — wen | — Y — | Meis 

GoodsNum OOO i ü Nmr | Y | 购买 商品 的 数量 
3. ODS 程序 设计 

ODS 程序 设计 见 表 12-24。 

表 12-24 ODS 程序 设计 

名 R 数 据 类 ETL 转换 规则 
PWM | usce | waa — | Y -| ERE 
Wd | — Name | va | O NOO OO MOBWRR.Cust Name 
Wa |  AdiCode | vacha | NO | 数据 源 表 Add_Code 
PAMA | Cust Type Code | Vamhango) | N | IUE. Cust Type Code 
ATE | GoodsType |  Vacha200 | N | 数据 源 表 .Goods Code 
Minim | GoodsNum | ”Number | NO | RE Goods Num 


设计 Mapping 如 图 12-41 所 示 : 采用 的 是 全 表 删 除 后 再 进行 数据 加 载 的 方式 。 
了 DO 


图 12-41 Mapping 设计 (一) 


Mapping 展开 后 如 图 12-42 所 示 。 





ZIZ|Z|Z|~ 
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CUST_BUYT_6000S 


(Qr 


Source Def inition 





CUST_NO 


va rchar 





DUST NAME varchar 


ADD CODE 


varchar 





PHONE NUMBER 





USERS. ID ND 





EMAIL 








GOODS CODE 





GOODS NUM 








EXPTRRANS1 
Expressio 


aE 


sh_CUST_BUY G00DS 
So ualifiet 


CUST_CODE . CUST_CODE 
NAME | NAME 

out add code — iif(to cha 
out goodstype iif(to cha 
CUST TYPE ... - 

out cust t... iif(to cha 
GOODSTYPE 
GOODSNUM - 


ADD CODE 








string 
string 
string 
double 
string 
string 
string 
string 
string 


CUST. NO 

CUST NÀME 
ADD CODE 
PHONE NUMBER 
USERS. ID. NO 
EMAIL - 

CUST TYPE ... 
GÜODS, CODE 
GOODS NUM 












































 GODSNUM - 

















图 12-42 Mapping 设计 (二 ) 


组 件 的 设计 如 图 12-43 所 示 。 


[Edit Transformations 





j ! 53 Bj T- 


nd Port Hame Datatype| Prec Scale|I|o|¥ Expression 


国王 
| ELLLNNENNM 


N' S 00 0 [qmm A 5 gU 
su os grs  —— 0 
Miecscee Fas 


回国 加 -和 | 


CO 
$... B m 


6000$... 
Definition 








NAME 
ADD CODE 
DUST TYPE CÜDE . 
GÜODSTYPE 
GOODSNUH 














number 

















7rr792272272222222222222222722222 224 4 4 42022272772 003 


» 
f 
f 
f 
f 
, 
f 
* 
f 
p 
^ 
f 
^ 
^ 
f 
A 
f 
f 
A 
A 
A 
* 
f 
f 
A 
* 
A 
f 
f 
f 
A 
» 
f 
* 
f 
p 
^ 
^ 
* 
f 
f 
A 
» 
A 
f 
p 
Pa 





口 口 




















图 12-43 组 件 的 设计 
其 中 地 址 编码 转换 如 图 12-44 所 示 。 


| 





hif (to char(4DD CODE)-' 001°,’ 101, iif (to char 
(ADD CODE)-'002','102', iif (to char(ADD CODE) 
-'003','103' , iif (to char(ADD CODE)-' 004' , ' 104" )))) 


Character 
Conversion 
Data Cleansing 
H-I Date 


Oo 
£3 
£e 
£e 
C3 
-C Numerical 
C3 
ae 
e» 
B 


Scientific 
H-O Special 

i Test 
Variables 














图 12-44 ”地 址 编码 转换 
客户 类 别 编码 转换 如 图 12-45 所 示 。 


| Expression Editor: out cust type code - EXPTRANS (Expression) 


iif(to char(CUST TYPE CODE)-' 12',' 11017, iif 
(to char(CUST TYPE CODE)-'13',' 1102' , 11f (to char 
(CUST TYPE CODE)-' 14,” 1103 ))) 


Character 
Conversion 
Data Cleansing 
BL Date 

Numerical 
Scientific 

EL Special 

i Test 

Variables 














12-45 客户 类 别 编码 转换 
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购买 商品 类 别 编码 转换 如 网 12-46 PTR. 









lli Expression Editor: out goodstype - EXPTRANS (Expression) 


E X| 
Functions | Ports | Variables | Formula ġà | | LP. 部 B x 


&-[ All Functions 


iif(to char(GOODSTYPE)-' 19 ,' 010, iif(to char 
(GOODSTYPE)-' 20' ,' 011’, iif (to char (GOODSTYPE) 
d- Data Cleansing -'21','012', iif(to char (GOODSTYPE)-' 22' ,' 013° )))) 





* CJ Scientific 
中 CJ Special 
h-E Test 

mL Variables 





Functions in the All Functions group. rNumeric keypad—, ;-Üperator keypad 


Cancel 
Validate 


Comments 





dli 

















Help 











图 12-46 ”购买 商品 类 别 编码 转换 
抽取 完成 之 后 ， 数 据 源 表 (CUST BUY GOODS) 12-47 所 示 。 


CUST NO CUST NANE ADD CODE PHONE NUNBER USERS ID NO EMAIL CUST TYPE, CODE GOODS CODE GOODS NUM 
1 E wmo | l io i 19 10 
2 8H w F 2 0» 3 T 15 
3 Eai Ww | 21 12 
4 t w | 1 2 10 





图 12-47 ”数据 源 表 
目标 表 (ODS CUST BUY GOODS) 如 图 12-48 所 示 。 


CUST CODE NAKE ADD CODE CUST TYPE CODE GOODSTYPE GOODSNUE 
0011 mK— 101 1101 010 10 
002 à gno — po o Qul —— gq5 —— 
0033 王 五 103 1103 012 12 
0024 AE 102 1103 013 10 


图 12-48 HERK 







12.84 DW 设计 和 与 抽取 


1. DW 表 结 构 说 明 
DW 表 结 构 说 明 见 表 12-25. 
表 12-25 DW 表 结 构 说 明 


zo Null) TENET: 
Cus Code sam 
Mon Hi 
Add Cul me 
Cust Type Code DIET 
GondsTyp TOAN 
Guo DERIT 
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2. DW 程序 设计 
DW 程序 设计 见 表 12-26。 
表 12-26 DW 程序 设计 


名 K 数据 类 型 ETL 转换 规则 
Hü | Mm | vao | Y OO MAP 
HUE | AdiCod | Vaaa |  N | ODs 浙 表 Add Code 
EPKEN | Cust Type Code | Varcha200) — | N | ODSiWi.Cus Type Code 
购买 商品 数量 | GoodsNum | Number |  N | ODS WK. GoodsNum 


设计 Mapping 如 图 12-49 所 示 : 抽取 频率 为 一 个 月 一 次 ， 使 用 的 方式 是 全 量 抽取 。 


K|12-49 Mapping 设计 (一 ) 
Mapping 展开 后 如 图 12-50 所 示 。 


5_CUST_BUY_6000S I EXPTRANS m D! CUST BUY GOODS ... 
Source Qualifier X io Target Def inition 


z|z|ziziz|«j|- 











CUST. CODE string CUST. CODE 


NAME string NAME 

| ADD. CODE ADD CODE string ADD CODE . CODE | ADD. CODE 

| GUST. TYPE CODE DUST TYPE ... string CUST TYPE ... | GUST. TYPE CODE 
| GOODSTYPE GOODSTYP string GOOUDSTYPE | GOODSTYPE 








K|12-50 Mapping 设计 (二 ) 


组 件 的 设计 如 图 12-51 所 示 。 
X 


Transformation Ports | Properties | Metadata Extensions | 


Select [6 EXPTRANS -| 


















































Transformation Expression 56 B € 
I|O|V = 
MME 
memi 
MMT 
ADD_CODE string 64 0 IV IRI ADD. CODE 
EEMCUST TYPE CODE string 20 0 Iv Iv E CUST TYPE CODE 
EE OOD STYPE string 20 0 Iv Iv E GOODSTYPE 
D COD SHUM double 15 0 Iv Iv E GOODSHUM 
E 


Default value: [ERROR ( transformation error') v 


Descripti« | | 





图 12-51 组 件 的 设计 
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抽取 完成 之 后 ， 数 据 源 表 (ODS CUST BUY GOODS) 12-52 所 示 。 








CUST CODE NAHE ADD CODE CUST TYPE CODE GOODSTYPE GOODSNUE 
0011 张 三 101 1101 010 10 
0012 李 四 101 1102 011 15 
0033 王 五 103 1103 012 12 
0024 刘 七 102 1103 013 10 














图 12-52 ”数据 源 表 
目标 表 (DW_ CUST BUY GOODS) 如 图 12-53 所 示 。 








CUST CODE NAHE ADD CODE CUST TYPE CODE GOODSTYPE GOODSNUE EON 
0011 张 三 101 1101 |010 10 ol 
0012 李 四 101 1102 011 15 01 
0033 王 五 103 1103 012 12 01 
0024 XJ |102 1103 013 10 01 























图 12-53 目标 表 


12.8.5 ”DM 设计 与 抽取 


1. DM 事实 表 结 构 说 明 
主题 摘 述 : 按照 时 间 、 地 区 、 商 品 燃 别 、 客 户 类 别 统计 客户 购买 商品 的 数量 ， 并 且 进 行 
环比 比较 〈 例 如 1 月 和 2 月 的 比较 )。 
维 : 时间、 地区、 商品 类别、 客户 类 别 。 
E: 客户 购买 商品 的 数量 。 
数据 源 : DW CUST BUY GOODS. 
主题 名 称 : 按 月 统计 客户 购买 商品 情况 分 析 。 
DM 事实 表 结 构 说 明 见 表 12-27。 
表 12-27 DM 事实 表 结 构 说 明 
£o 称 Null( 是 否 为 空 描述 
CusiCode LITT 
Mon 月 从 
DistrictCodo UKAT 
CustTypoCodo ETIN 
GoodsCode DENEN 
GoodsNum 购买 商品 的 数量 
2.DM 维 表 结 构 说 明 
维 表 的 数据 直接 从 ODS 编码 表 采 用 增 量 的 方式 进行 抽取 。 
地 区 维 表 如 图 12-54 所 示 。 


Name Code DataType Primary ETL 转 换 规 则 
地 区 编码 DistrictCode Varchar2(20) yes oD$ 地 区 编码 表 的 编码 字段 




















地 区 名 称 DistrictName ^ Varchar2(400) no ODS 地 区 编码 表 的 名 称 字 段 





图 12-54 地 区 维 表 
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商品 类 别 维 表 如 图 12-55 所 示 。 


Name Code DataType Primary ETL 转 换 规 则 
商品 类 别 编 码 GoodsCode varchar2(20) yes 0DS 商 品类 别 编 公 表 的 编码 字段 


商品 类 别名 称 ^ GoodsName warchar2(400) no ODS 商品 类 别 编 码 表 的 名 称 字 有 段 








图 12-55 商品 类 别 维 表 
客户 类 别 维 表 如 网 12-56 所 示 。 


Name Code Data Type Primary ETL 转 换 规 则 
客户 类 别 编 码 QustTypeCode —— Varchar2(20) yes 0Ds 客 户 类 别 编码 表 的 编码 字段 


客户 类 别名 称 ”QustTypeName ”如 rchar2la00] no 0Ds 客 户 类 别 编码 表 的 名 称 字段 





图 12-56 客户 类 别 维 表 
3. DM 程序 设计 
DW 的 物理 模型 如 图 12-57 PTR. 











| 客户 类 别 维 表 地 区 维 表 
客户 类 别 编 码 varchar2(20) 《pk> EAR varchar2(20) 《pk> 
客户 类 别名 称 varchar2(400) 地 区 和 名称 varchar2(400) 

ka *« 


: 按 月 统计 客户 购买 "REFERENCE 客户 类 别 维 表 ”_ 按 月 统计 客户 ROX REFERENCE it 区 维 表 





按 月 统计 客户 购买 商品 情况 分 析 


varchar2(20) 
varchar2(20) 
码 varchar2(20) 《fkl> 
码 varchar2(20) 《fk2》 
varchar2(20) 《fk3> 
量 number 





mimm 
HRE nS n 
I 洲 
nrw 型 
» ww 











: 按 月 统计 客户 购买 _ REFERENCE 商品 类 别 维 表 


» 
商品 类 别 维 表 


商品 类 别 编码 varchar2(20) 《pk> k^ 
商品 类 别名 称 varchar2(400) 











图 12-57 DM 的 物理 模型 
设计 Mapping 如 图 12-58 所 示 : 抽取 频率 为 一 个 月 一 次 ， 使 用 的 方式 是 全 量 抽取 。 





图 12-58 Mapping 设计 (一) 
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Mapping 展开 后 如 图 12-59 所 示 。 


p= ON CUST EUY 6000S z m SA DI. CUST. BU'T- GOODS Bm - GATRA 7 Amb (... BH 


Source Definition 


Source Aualif ier | ETE) m Target Definition 


- | | CUST. CODE (UST. DODE 
| NAME NAME | 
| ADD. CODE ADD. CODE | ET Bl | DISTRICTGDDE 
| LUST TTPE CODE (UST TIPE CODE | GOODSTYPE H | GOCDSCODE 
| BOODSTYPE GOODSTYPE | GOODENUN B | CUSTTYPECODE 





图 12-59 Mapping 设计 (二 ) 


12.9 kx 


1) ETL 是 数据 抽取 (ExtracD、 转 换 (Transform)、 加 载 (Load) 的 简写 ， 它 贯穿 了 整个 商业 智 
能 项 目 ， 是 构建 数据 仓库 最 重要 的 一 步 。 系 统 通过 ETL 过 程 将 数据 源 中 的 数据 经 过 转换 和 整 
合 加 载 到 数据 仓库 中 。 

2) ETL 的 框架 结构 包含 了 业务 数据 源 、ODS 数据 缓冲 区 、ODS 统一 信息 视图 区 、 数 据 
仓库 、 数 据 集 市 等 内 容 。 

3) ETL 的 流程 包含 了 从 源 数 据 抽取 到 ODS 数据 缓冲 区 、 从 ODS 数据 缓冲 区 抽取 到 
ODS 统一 信息 视图 区 、 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 、 从 数据 仓库 抽取 到 数据 集 
市 的 过 程 。 

4) ETL 的 加 载 方 法 有 4 种 。 

e 以 时 间 崔 作为 加 载 数据 的 条 件 。 

e 利用 源 表 的 日 志 信 息 对 目标 表 进 行 数 据 加 载 。 

e 通过 全 表 对 比 的 方式 进行 数据 加 载 。 

e 全 表 删 除 后 再 进行 数据 加 载 。 

5) ETL 的 设计 过 程 : 数据 源 和 ODS 之 间 的 对 应 ，ODS 和 数据 仓库 之 间 的 对 应 ， 数 据 仓 
库 和 数据 集 市 乙 间 的 对 应 。 

6) ETL 数据 质量 改进 的 困难 体现 在 : 数据 量 较 大 ， 数 据 类 型 不 统一 ; 数据 质量 没有 一 个 
清晰 明确 的 标准 和 定义 。 系 统 的 改造 和 升级 或 者 是 人 为 因 北 ， 都 可 能 导致 数据 的 混乱 。 

7) 在 进行 ETL 数据 质量 分 析 时 ， 需 要 不 断 进 行 修 正 ， 尽 量 使 该 系统 的 编码 满足 编 但 规 
范 和 要 求 。 可 以 采取 使 用 代理 键 的 方法 去 维护 编码 的 可 追溯 性 和 唯一 性 ， 除 此 以 外 ， 还 需要 
过 滤 系 统 的 起 圾 数据 ， 建 这 人 工 映 射 表 去 统一 和 匹配 编 但 不 一 致 的 部 分 数据 。 

8) ETL 数据 质量 主要 从 技术 层面 、 管 理 层 面 、 业 务 层 面 等 角度 去 分 析 和 改进 。Q) Mix 
术 层 面 来 说 ， 需 要 对 源 数据 进行 清洗 ， 以 过 滤 反 垃圾 数据 和 存在 不 一 致 性 的 数据 ， 同 时 需要 
对 源 数据 的 质量 进行 评 佑 ， 然 后 根据 业务 实际 情况 设计 出 完整 的 数据 质量 改进 方案 。@ 从 管 
理 层 面 来 说 ， 我 们 应 该 切实 保证 从 业务 系统 源 数 据 到 数据 集 市 中 各 个 环节 的 数据 的 正确 性 、 
一 致 性 和 完整 性 。@) 从 业务 层面 来 说 ， 对 源 数 据 的 抽取 需要 遵循 相应 的 业务 规则 ， 将 ETL 
的 过 程 流 程 化 、 规 范 化 。 
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第 13 章 联机 分 析 处 理 


本 章 目标 

D 通过 本 章 的 学 习 ， 理 解 OLAP 的 基本 概念 。 

2) 通过 OLAP 实施 的 一 般 过 程 ， 和 掌握 OLAP 的 实施 方法 。 

3) 通过 OLAP 系统 设计 的 一 般 步 又， 掌握 OLAP 系统 设计 的 方法 。 
学 习 本 章 后 ， 您 将 掌握 : 

e OLAP 的 基本 概念 。 

© OLAP 的 实施 过 程 。 

e 什么 是 多 维 分 析 。 

€ OLAP 系统 设计 的 一 般 步 骤 。 


13.1 OLAP 的 概念 








OLAP【 联 机 分 析 处 理 ) 是 根据 用 户 特 吻 的 需求 而 进行 的 联机 数据 分 析 ， 包括 对 数据 仓库 
的 分 析 ， 是 业务 分 析 人 员 、 中 层 管 理 人 员 、 企 业 领 导 者 从 多 角度 对 企业 数据 进行 深入 理解 的 
一 类 技术 。 





13.2 OLAP 的 实施 


13.2.1 建立 ” 维 ” 的 概念 


理论 篇 已 经 大 致 介绍 了 OLAP 的 理论 知识 ， 下 面 将 从 项 目的 角度 介绍 OLAP 的 实施 过 
程 ， 肯 先 用 维度 去 思考 周围 的 现实 世界 。 欠 一 个 军火 商 销 售 的 例子 ， 和 军火 商 销 售 一 般 考 虑 的 
征 销售 额 、 销 售 的 成 本 和 利润 。 表 13-1 是 一 张 典 型 的 二 维 数 据 表 ， 其 中 月 份 束 是 一 个 关键 的 














表 13-1 二 维 数据 表 


syIAIAaJ AIS NIJ =| 
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如 果 要 在 这 张 二 维 表 的 基础 上 增加 车 火 的 类 别 ， 可 引入 立方 体 的 概念。 

所 谓 立方 体 ， 就 是 多 维度 和 度量 值 组 成 的 逻辑 结构 ， 如 图 13-1 所 示 。 

在 图 13-1 中 ， 可 知 该 立方 体 的 维度 是 月 份 和 销售 军火 的 类 别 ， 度 量 值 是 销售 额 、 成 本 、 
利润 。 引 入 了 以 下 概念 : 维度 、 维 度 的 层次 、 类 别 、 度 量 。 

维度 : 用 来 对 数据 进行 分 类 的 结构 和 人 们 观察 业务 情况 的 角度 。 

维度 的 层次 : 根据 维度 细节 程度 的 不 同 ， 划 分 出 来 的 一 类 属性 ， 是 维度 中 预先 定义 的 不 
同 级 别 。 例 如 ， 日 期 维度 的 层次 包括 年 、 月 、 日 。 

类 别 : 是 维度 上 各 层次 的 数据 项 取 值 。 例 如 ， 日 期 维度 中 层次 月 的 类 别 有 : 1 月 、2 月 、 
3 月 等 ， 如 图 13-2 所 示 。 
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图 13-1 立方 体 


度量 : 用 来 描述 业务 情况 的 数值 型 数据 ， 存 储 的 是 多 维 数据 。 例 如 ， 销 售 额 、 销 售 的 成 
本 和 利润 都 是 度量 值 ， 度 量 值 乙 间 都 是 相互 独立 的 。 


13.2.2 ”多 维 分 析 技 术 


多 维 分 析 是 以 多 维 的 形式 组 织 数据 ， 并 且 采 用 切片 、 切 块 、 钻 取 、 旋 转 等 多 种 分 析 方 式 
探查 数据 ， 使 分 析 人 员 或 者 管理 人 员 能 够 从 多 方面 、 多 角度 去 查询 数据 ， 从 而 得 到 有 价值 的 
信息 。 读 者 需要 理解 以 下 几 个 概念 : 

ZEE (Drill Through): 是 对 详细 信息 的 钻 取 。 例 如 ， 可 以 通过 单 击 军火 的 名 称 进入 到 它 
的 详细 信息 页 面 ， 如 图 13-3 所 示 。 



































直升机 种 类 直升机 型 号 直升机 身长 AMAA AMS 


序号 军火 名 称 





1 直升机 运输 直升机 CH—47 15.54 米 3.78 米 ”5.58 米 


图 13-3 ”和 穿 透 例子 


上 和 外 (Drill-Up): 在 维度 中 从 细 到 粗 展 示 数 据 ， 从 而 变换 分 析 的 粒度 。 例 如 在 “月 ” 维 
中 可 以 上 钴 到 和 它 的 上 级 “年 ” 如 图 13-4 所 示 。 
下 钻 CDrill-Down): 在 维度 中 从 粗 到 细 展 示 数 据 ， 从 而 变换 分 析 的 维度 。 例 如 在 “年 ” 
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维 中 可 以 下 钻 到 它 的 下 级 “月 ” 如 图 13-5 所 示 。 


Hio WEM 成 本 利润 年 LI RE AW 





1 2000 1200 800 2011 24000 20000 9800 


图 13-4 ”上 钻 例子 


月 份 LI MEE 成 本 利润 


2 2400 1350 1050 


6 2300 1300 1000 


年 LII RE AW 





T 2900 1300 1200 


图 13-5 下 钻 例 子 


切片 (Slice): 在 维 上 选 定 值 后 ， 列 出 这 个 范围 内 的 数据 。 例 如 在 图 13-6 中 ， 可 以 得 到 
军火 类 别 维 (军用 卡车 、 普 通 步 兵 枪 、 坦 殉 、 火 第 位 、 直 升 机 )， 日 期 维 (1 Ho 的 销售 额 、 
成 本 、 利 润 情况 。 

切 块 (Dice): 切 块 是 在 切片 的 基础 上 ， 在 维 上 选择 的 值 是 一 个 区 间 ， 然 后 列 出 这 个 围 
内 的 所 有 值 ， 这 个 区 间 的 值 多 于 两 个 。 

例如 在 图 13-7 中 ， 可 以 得 到 车 火 闫 别 维 〈 苗 用 卡 和 车、 普通 步 兵 枪 、 坦 区 、 火 区 人 简 、 再 升 
机 )， 日 期 维 (1 月 、2 月 、3 Ho WAEI BAN. RTT 
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图 13-6 切片 图 13-7 UJ 
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旋转 (Pivot): 类 似 于 行列 互 换 ， 通 过 改变 维度 的 方 问 重 狐 安排 表格 的 摆 放 形式 。 例 如 ， 
K 13-2 经 过 旋转 变 为 表 13-3 形式 。 





表 13-2 表格 一 


L5 pepe ps- 
销售 额 1100 1300 "A 1500 1300 1400 1500 1500 


E 
aj 
N 
© 
p< 
© 
T 
© 
EN 
EY 
T 


利润 200 200 300 250 400 400 500 600 
表 13-3 表格 二 
2010 年 
2011 年 


19.2.8 ”OLAP 实 施 的 一 般 过 程 


(1) 需求 阶段 

需求 分 析 包 括 通过 调研 得 出 的 业务 需求 (从 维度 、 各 业务 的 分 析 主 题 等 方面 进行 描述 )、 
性 能 需求 (系统 啊 应 时 间 的 要 求 )、 技 术 和 需求 (例如 系统 建 并 在 Cognos 平台 基础 上 ， 
Informatica 作为 ETL 的 工具 )、 安 全 性 需求 和 需求 的 优先 级 等 内 容 。 在 需求 阶段 ， 我 们 应 该 
积极 主动 地 与 客户 联系 ， 明 确 OLAP 系统 的 实现 内 容 。 在 通 单 情况 下 ， 和 客户 也 会 逐渐 熟悉 数 
据 仓库 系统 、OLAP 系统 的 功能 ， 了 解 相 关 的 数据 仓库 产品 知识 ， 同 时 也 是 我 们 熟悉 相关 业 
务 知识 的 过 程 。 

(20 规划 阶段 

在 需求 分 析 的 基础 上 ， 需 要 对 项 目的 整体 结构 有 一 定 的 了 解 ， 按 照 软 件 工 程 的 一 般 规 则 
和 方法 规划 整个 项 目的 过 程 。 同 时 需要 确定 整个 项 目 需要 的 资源 ， 包 括 多 少 人 力 ， 做 哪些 相 
关 的 培训 等 内 容 。 

(3) 设计 阶段 

设计 阶段 是 整个 OLAP 项 目 最 重要 的 阶段 ， 包 括 对 模型 的 分 析 、OLAP 维度 的 分 析 和 设 
计 、 事 实 表 的 设计 等 内 容 。 模 型 的 分 析 包 括 定 义 问 题 和 确定 分 析 的 目标 和 内 容 ，OLAP 可 以 
解决 哪些 重要 的 问题 ， 例 如 军火 商 全 年 销售 的 直升机 利润 总 额 是 多 少 ， 销 售 火 箭 简 在 1 月 、2 
月 、3 月 消耗 的 成 本 是 多 少 等 内 容 。OLAP 维度 的 分 析 包 括 分 析 问 题 中 所 涉及 的 维度 是 哪些 
每 个 主题 中 维度 和 度量 值 是 多 少 。 例 如 ， 和 苗 火 商 销售 苗 火 情况 主题 承 涉 及 军火 闫 别 、 日 期 两 



































$25 


个 维度 ， 如 图 13-8 R. EACASIAEISE PUE HI RAE. PES Hn. Km. EWL, 
而 日 期 维度 包含 一 年 当中 的 12 个 月 。 


军火 类 型 维 表 


varchar2(20) 《pk> 








日 期 维 表 


日 期 编码 varchar2(20) «pk? 
月 份 名 称 varchar2(20) 





军火 编码 
军火 和 名称 varchar2(400) 





Fi 
"d 
[y 


EST SH ES SR UCIB REF ERENCE X 军火 商 销售 军 兴 情 REF FERENCE_ 日 期 礁 表 


f 
Fj 


3E Ak fa dH Es 3E 2C TR OG ie EL 
主键 ID — varchar2(20) <pk> 
编码 varchar2(20) <fk1> 
编码 varchar2(20) 《fk2》 
varchar2(20) 
varchar2(20) 





ES 
Bi varchar2(20) 
图 


13-8 物理 模型 设计 


(4) 构建 模型 阶段 

根据 业务 的 需求 确定 需要 分 析 的 主题 ， 根 据 分 析 的 主题 确定 分 析 的 粒度 和 度量 值 ， 包 括 
分 析 的 维度 。 例 如 ， 军 火 丙 销售 车 火 情 况 信 息 主题 主要 从 蔡 火 类 型 、 日 期 维度 两 方面 进行 分 
析 。 最 后 测试 和 验证 模型 的 正确 性 。 

(5) 报表 展现 阶段 

在 报表 展现 阶段 ， 可 以 利用 成 熟 的 报表 展示 工具 (例如 Cognos)， 在 模型 的 基础 上 对 主 
匮 进行 多 角度 的 分 析 ， 最 后 进入 到 报表 的 测试 阶段 和 运行 验收 阶段 。 

OLAP 实施 的 一 般 过 程 如 图 13-9 所 示 。 


OLAP 实施 的 一 般 过 程 : 
。 需求 阶段 
。 规划 阶段 
。 设计 阶段 
。 构 建 模型 阶段 
。 报表 展现 阶段 


































图 13-9 OLAP 实施 的 一 般 过 程 
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13.3 OLAP 的 应 用 实例 


13.3.1 案例 背景 


对 车 火 商 的 销售 情况 进行 数据 分 析 。 在 数据 库 中 存在 3 张 表 : 军火 商 销 售 车 火 情况 信息 
表 、 日 期 维 表 、 军 火 类 型 维 表 。 


13.3.2 ”需求 


作为 军火 销售 的 决策 者 ， 最 关注 的 信息 就 是 2010 年 和 2011 年 军火 销售 的 情况 ， 包 括 军 
火 销 售 额 、 销 售 成 本 、 利 泣 。 为 了 秀 穴 车 火 销 售 的 趋 芬 ， 决 策 者 希望 看 到 销售 额 、 销 售 成 本 、 
利润 按照 日 期 或 者 车 火 类 型 划分 的 分 布 情况 。 决 集 者 通过 日 期 、 车 火 类 型 等 几 个 方面 分 析 销 
售 情况 ， 为 以 后 的 决 案 提供 辅助 文 持 。 

1. 分 析 的 主题 

军火 商 销 售 车 火 情 况 信 息 主 题 。 

2. 分 析 的 事实 

销售 额 、 销 售 成 本 、 利 洞 。 

3. 分 析 的 角度 

日 期 、 车 火 类 型 。 

4. 分 析 的 粒度 

日 期 : 月 。 

5. 数据 的 分 析 

D 不 同类 型 车 火 的 销售 迟 况 。 

2) 车 火 销 售 按照 时 间 的 分 布 情况 。 

3) 通过 不 同 的 车 火 类 型 、 日 期 两 个 方面 分 析 车 火 销 售 的 情况 。 


13.3.3 ”数据 准备 


(1) 维 表 的 数据 
军火 类 型 维 表 见 表 13-4。 























表 13-4 军火 类 型 维 表 


军火 编码 军火 名 称 车 火 编码 车 火 名 称 


日 期 维 表 见 表 13-5. 


$25 


13-5 日 期 维 表 


(2) 事实 表 的 数据 
军火 商 销 售 军 火 情 况 信 息 表 见 表 13-6. 














表 13-6 军火 商 销售 军火 情况 信息 表 


13.3.4 浏览 分 析 数 据 


在 完成 需求 分 析 和 数据 状 载 之 后 ， 进 行 多 维 数据 集 的 分 析 。 下 和 面 以 Cognos 作为 BI (A 
业 智 能 ) 展示 工具 举例 如 下 : 

(1) 构建 数据 模型 

使 用 Framework Manager 工具 构建 数据 模型 并 且 友 布 ， 如 图 13-10 所 示 。 

(2) 数据 分 析 展 示 

军火 商 销售 军火 情况 信息 如 图 13-11 所 示 。 
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图 13-10 构建 数据 模型 


S00 


01 HEF 2000 1200 
普通 步兵 村 300 400 500 
01 2900 1600 1300 
D2 HFE 2400 1350 1050 
Hm, 750 500 250 
ü2 3150 1850 1300 
03 车 用 卡 丰 600 300 300 
坦克 1500 300 700 
03 2100 1100 1000 
04 光盘 和 莘 1900 1000 ann 
[gm 1000 750 250 
坦克 2100 1500 600 
04 5000 3250 1750 
05 HFE S00 300 200 
EH IL 2100 1200 anu 
05 2600 1500 1100 
06 EB S Fea 2300 1300 1000 
06 2300 1300 1000 
07 普通 步兵 村 1900 1500 400 
Hm, 2500 1300 1200 
07 4400 2800 1600 
Summary 227450 13400 9050 





图 13-11 车 火 商 销售 车 火 情况 信息 





13.4 OLAP 系 统 设计 的 一 般 步 又 


(1) 对 OLAP 系统 环境 的 摘 述 

包括 OLAP 系统 的 数据 库 环境 (例如 Oracle 10g), OLAP 系统 使 用 的 应 用 服务 器 平台 ( 例 
如 Cognos 8.3)， 运 行 环境 (例如 Java JDK 1.4 UE), HERA Alun Microsoft Windows XP 
Service Pack 3)， 应 用 系统 开发 环境 (例如 Eclipse 3.2)， 开 发 语言 (例如 Java) 等 内 容 。 

(2) 维度 和 度量 的 设计 

维度 设计 包括 维度 名 称 、 层 次 、 成 员 和 属性 等 要 素 ， 一 般 需 要 描述 维度 各 目的 特性 ， 例 
如 维度 的 变化 情况 〈 固 定 维度 、 维 度 绥 慢 变化 和 维度 快速 变化 3 种 情况 )、 生 成 新 的 维度 代理 
键 ， 新 维度 的 生成 情况 《将 不 同 的 分 析 角 度 进 行 合并 ， 形 成 新 的 维度 ) 等 内 容 。 上 度量 的 设计 
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一 般 包括 度量 的 名 称 、 属 性 、 粒 度 等 内 容 。 

(3) 维度 模型 的 设计 

维度 模型 包含 两 种 不 同性 质 的 表 : 事实 表 和 维度 表 ， 如 图 13-12 所 示 。 其 中 事实 表 是 模 
型 的 核心 表 ， 包 含 两 个 或 者 两 个 以 上 的 外 键 关 键 子 ， 它 连接 到 相应 的 维度 表 的 主键 上 。 维 度 
表 包 含 关键 子 、 属 性 列 ， 它 提供 了 数据 分 析 的 角 虑 。 























时 间 维 度 客户 维度 


时 间 ID ”varchar2l40) i 客户 ID varchar2(40) 

时 间 编 码 varchar2140) A / 客户 类 型 ”varchar2140) 

\ /| 二 varcharzto 

A 客户 j da / 电子 邮箱 varchar2(40] 
1 


m 
地 区 维度 / x ER. E 3:3 
/ v m 


地 区 ID ^—varchar2(40) / b" 
地 区 名 称 varchar2i40) 商品 名 称 varchar2(40) 


图 13-12 维度 模型 的 设计 


其 中 维度 表 采 用 代理 关键 字 时 间 ID、 地 区 ID, X ID, Aim ID 替代 源 系 统 的 关键 字 。 

为 了 使 数据 仓库 中 的 维度 信息 与 源 系 统 的 信息 对 应 起 来 ， 也 会 将 源 系 统 的 关键 字 存 储 在 
维度 表 中 。 例 如 ， 时 间 维 度 表 中 的 时 间 编 码 焉 是 从 源 系 统 中 直接 抽取 出 来 的 ， 该 时 间 编 码 包 
含 了 年 、 季 、 月 的 信息 ， 将 这 些 信息 从 源 系 统 中 抽取 出 来 ， 经 过 转换 变 成 年 、 季 、 月 3 个 时 
则 属性 提供 给 时 间 维 度 表 。 维 度 表 可 以 进行 层次 化 的 处 理 , 例如 时 间 维 度 包 仿 了 年 、 季 、 月 3 
个 层次 。 同 时 ， 维 度 表 又 对 该 属性 值 进 行 了 处 理 ， 例 如 在 源 系 统 中 对 客户 类 型 会 采用 编码 的 
形式 进行 存储 ， 而 在 维度 表 中 用 本 来 的 含义 去 蔡 代 编码 ， 例 如 客户 类 型 : VIP 客户 、 注 册 客 
P EBERT EARR V. Z. P. 

OLAP 系统 设计 的 一 般 步 又 如 图 13-13 所 示 。 














































对 OLAP 系统 


环境 的 描述 


的 设计 


维度 模型 
的 设计 









图 13-13 OLAP 系统 设计 的 一 般 步 又 


13.5 本章 小 结 


1) OLAP【〔 联 机 分 析 处 理 ) 是 根据 用 户 特 殊 的 需求 而 进行 的 联机 数据 分 析 ， 包 括 对 数据 
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仓库 的 分 析 ， 是 业务 分 析 人 员 、 中 层 管理 人 员 、 企 业 领 导 者 从 多 角度 对 企业 数据 进行 深入 理 
解 的 一 类 技术 。 

2) 维度 : 用 来 对 数据 进行 分 类 的 结构 和 人 们 观察 业务 情况 的 角度 。 

3) 多 维 分 析 是 以 多 维 的 形式 组 织 数据 ， 并 且 采 用 切片 、 切 块 、 钻 取 、 旋 转 等 多 种 分 析 方 
式 探查 数据 ， 使 分 析 人 员 或 者 管理 人 员 能 够 从 多 方面 、 多 角度 去 查询 数据 ， 从 而 得 到 有 价值 
的 信息 。 

4) FE (Drill Through): 是 对 话 细 信 息 的 钻 取 。 

5) LE (Drill-Up): 在 维度 中 从 细 到 粗 展示 数据 ， 从 而 变换 分 析 的 粒度 。 

60 下 外 (Drill-Down): 在 维度 中 从 粗 到 细 展 示 数 据 ， 从 而 变换 分 析 的 维度 。 

7) 切片 (Slice): 在 维 上 选 定 值 后 ， 列 出 这 个 范围 内 的 数据 。 

8) 切 块 (Dice): 切 块 是 在 切片 的 基础 上 ， 在 维 上 选择 的 值 是 一 个 区 间 ， 然 后 列 出 这 个 
范围 内 的 所 有 值 ， 这 个 区 间 的 值 多 于 两 个 。 

9) 旋转 (Pivot): 类 似 于 行列 互 换 ， 通 过 改变 维度 的 方向 重新 安排 表格 的 捍 放 形式 。 

100 OLAP 的 实施 过 程 包括 : 需求 阶段 、 规 划 阶 段 、 设 计 阶 段 、 构 建 模型 阶段 、 报 表 展 
现 阶 段 。 

11) 设计 阶段 是 整个 OLAP 项 目 最 重要 的 阶段 ， 包 括 对 模型 的 分 析 、OLAP 维度 的 分 析 
和 设计 、 事 实 表 的 设计 等 内 容 。 

12) 根据 业务 的 需求 确定 需要 分 析 的 主题 ， 根 据 分 析 的 主题 确定 分 析 的 粒度 和 度量 值 ， 
包括 分 析 的 维度 。 

13) OLAP 系统 设计 的 一 般 步 又 包括 : 对 OLAP 系统 环境 的 描述 、 维 度 和 度量 的 设计 、 
维度 模型 的 设计 。 






































159 


第 14 章 应 用 举例 


本 章 目标 

本 章 通 过 一 个 简单 的 营销 系统 和 案例， 描述 了 商业 智能 项 目 开发 的 整体 流程 ， 包 括 项 目 计 
划 的 制订 、 和 需求 分 析 、 始 销 系统 设计 、ETL 数据 抽取 、 报 表 展 示 等 内 容 。 这 也 是 对 理论 遍 和 
项 目 篇 内 容 的 一 个 忌 结 。 

FAKE, KKJ: 

e 如 何 制订 项 目 工作 计划 。 

e 如 们 进行 需求 分 析 。 

e 如 何 进行 企业 数据 概念 模型 建设 。 

e 如 何 进行 企业 数据 旬 辑 模型 建设 。 

e 如 何 进行 数据 仓库 物理 模型 建设 。 








14.1 “项 目 工作 计划 的 制订 


14.1.1 对 项 目 背景 与 目的 的 描述 


项 目 背 景 主要 包括 现 有 的 信息 系统 ， 每 个 信息 系统 的 业务 需求 ， 各 个 信息 系统 建立 的 时 
期 ， 每 个 信息 系统 建立 时 采用 的 数据 模型 。 例 如 ， 和 营销 系统 是 不 同 的 省 、 市 地 区 建立 的 相对 
独立 的 信息 系统 ， 采 用 的 数据 模型 也 大 多 是 系统 供应 丙 根 据 不 同 的 业务 需求 而 设计 出 来 的 。 
因为 相对 独立 的 信息 系统 缺乏 统一 的 设计 和 规划 ， 它 们 有 各 目的 标准 和 业务 需求 ， 这 就 造成 
本 企业 数据 存在 不 统一 性 和 分 专 性 ， 每 个 业务 系统 之 间 不 能 实现 信息 的 共 圣 和 交互 ， 对 企业 
有 效 利用 数据 资源 造成 了 极 大 的 困难 。 为 了 实现 数据 资源 的 有 效 利用 ， 企 业 需 要 建立 统一 的 
数据 模型 ， 实 现 企业 信息 资源 的 共享 ， 为 企业 的 业务 分 析 和 决策 支持 带 来 方便 ， 这 就 是 项 目 
建设 的 根本 目的 。 

对 项 目 背景 和 目的 的 描述 有 利于 项 目 成 员 和 
项 目 干系 人 达成 共识 ， 使 项 目 成 员 了 解 项 目的 相 















































关 情况 和 各 项 任务 ， 明 确 项 目的 服务 对 象 和 系统 memes cue | [eomm 
使 用 后 应 该 达到 的 效果 等 内 容 ， 如 图 14-1 所 示 。 | 不同 信息 系统 的 业 利用 
务 需 求 。 实 现 信息 资源 的 共 
14.1.2 确定 项 目 需 要 交付 的 成 。 各 个 信息 系统 建立 * 
确定 需要 交付 的 成 果 的 时 期 。 为 企业 的 业务 分 析 
Wr Mat HF TRI E] SEHR AR A UT EN HE. AERA] E [P 。 每 个 信息 系统 建立 和 决策 支持 带 来 方 
数据 仓库 项 目 需 要 交付 的 成 果 主 要 包括 以 下 [ERER | m 


几 个 部 分 ， 如 图 14-2 所 示 。 
D 在 对 现 有 应 用 系统 分 析 的 基础 上 ,提交 摘 
述 数据 现状 分 析 的 文档 。 文 档 内 容 主要 包括 主要 图 14-1 项 目 普 晤 与 日 的 的 措 述 
业务 现状 例如， 营销 系 统 的 主要 业务 现状 包括 
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它 的 管理 模式 和 业务 描述 )， 主 要 业务 数据 现状 , 〈 例 如 ， 关 键 实 体 、 关 键 指标 是 什么 )， 决 案 


分 析 现 状 。 







描述 数据 现状 
分 析 的 文档 





模型 框架 
E 
明文 档 





图 14-2 数据 仓库 项 目 需要 交付 的 成 末 

2) 数据 概念 模型 说 明文 档 。 

3) 数据 逻辑 模型 框 染 文档 和 有 关 主 题 的 数据 风 辑 模型 的 说 明文 档 。 

4) ODS、 数 据 仓库 模型 设计 说 明 书 和 数据 集 市 设计 说 明 书 。 
14.1.3 ”制定 项 目 管理 文档 

项 目 管理 文档 如 图 14-3 Bron. 

(1) 项 目 计 划 书 项 目 计 划 书 

项 目 计 划 书 是 项 目 成 员 和 项 目 干 系 人 了 解 项 目的 











桥梁 ， 项 目 开发 团队 就 是 通过 项 目 计 划 书 开展 项 目 设 
计 、 开 发 等 工作 ， 项 目 管理 者 也 是 通过 项 目 计 划 书 开 


展 对 项 目的 监督 和 管理 方面 的 工作 。 项 目 计 划 书 包含 
的 内 容 可 以 是 项 目 团队 的 组 织 结构 、 项 目 各 成 员 的 工 
作 任 务 和 职责 、 项 目 工 作 的 任务 分 解 、 项 目的 经 费 预 图 14-3 
向 

(2) 会 议 纪 要 模板 








项 目 管理 文档 


会 议 纪 要 的 内 容 主 要 包括 会 议 主题 、 会 议 时 间 、 会 议 地 点 、 会 议 主 桂 人 、 参 会 人 员 、 会 


议 纪要 等 ， 如 图 14-4 所 示 。 
(3) 项 目 周报 模板 








项 目 周 报 的 主要 内 容 包 含 项 目 恕 体 的 进展 情况 ， 例 如 项 目的 当前 进度 和 成 末 ， 本 周 主要 
完成 了 哪些 工作 、 完 成 的 情况 如 何 ， 在 项 目 设计 开发 过 程 中 出 现 了 哪些 问题 、 问 题 的 解决 方 
案 是 什么 ， 下 周 的 主要 工作 有 哪些 ， 如 图 14-5 所 示 。 这 些 内 容 都 可 以 反映 到 项 目 周报 中 ， 从 





而 使 项 目 管 理 者 及 时 了 解 项 目的 进展 情况 和 人 员 的 工作 情况 等 信息 。 
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六 六 六 六 六 六 六 而 E] 
工作 周报 


总 体 进展 情况 : 
项 目的 当前 进度 和 成 果 是 什么 ? 
本 周 主 要 完成 了 哪些 工作 、 完 成 的 情况 如 何 ? 


项 目 存 在 哪些 问题 及 解决 方案 是 什么 ? 
下 周 主要 工作 有 哪些 ? 





图 14-4 ”会议 纪 要 模板 图 14-5 项 目 周 报 模板 


14.1.4 项 目 进度 划分 
项 目 进 度 划 分 见 表 14-1。 其 中 调研 过 程 可 以 分 成 以 下 儿 个 步骤 ， 如 图 14-6 所 示 。 
表 14-1 项 目 进度 划分 


工作 任务 项 目 开 始 时 间 项 目 结束 时 间 所 需要 的 资源 备注 信息 


务 人 员 配 合 、 沟 通 


Ul 
ODS, 数据 仓库 、 数据 集 市 sexe ste tete te 炒米 炒米 炒米 米 Jui El ZH AF > 人员 


针对 不 同人 
员 的 调研 


图 14-6 调研 过 程 


d 


a 


(1) 制订 调研 计划 
确定 调研 目标 、 调 研 人 员 和 组 织 。 
C20 对 调研 计划 的 实施 
主要 包括 会 议 访 谈 和 问 闪 调 伍 丙种 方式 。 
(3) 针对 企业 局 层 领 导 的 调研 
了 解 现 阶段 企业 工作 的 重点 ， 领 导 遍 层 最 天 心 哪些 指标 、 对 数据 仓库 的 期 望 ， 分 析 领 导 
关心 的 领域 与 哪些 主题 域 相关 。 
(4) 针对 企业 管理 人 员 的 调研 
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了 解 企 业 管理 人 员 最 关心 的 指标 有 哪些 ， 管 理 人 员 、 考 核 下 属 职工 的 指标 与 哪些 主题 域 
相关 ， 和 常理 人 员 和 希望 数据 仓库 能 够 所 供 哪 芋 有 价值 的 分 析 功 能 。 

(5) 针对 业务 人 员 的 调研 

了 解 业 务 人 员 最 关心 的 指标 有 哪 芋 ， 业 务 人 员 布 望 数据 仓库 能 够 提供 哪些 分 析 功 能 。 

C60 针对 IT 技术 人 员 的 调研 

了 解 IT 技术 人 员 最 关心 的 指标 有 哪些 ，IT 技术 人 员 和 希望 数据 仓库 能 够 提供 哪些 分 析 功 
能 ， 业 务 系 统 的 数据 刷新 频率 是 多 少 。 


14.2 ”需求 分 析 
14.2.1 业务 需求 


下 面 以 营销 系统 为 例 ， 介 绍 如 何 进行 业务 需求 分 析 。 

1) 将 营销 系统 整体 上 划分 成 几 个 部 分 : 例如 ， 可 以 划分 成 报表 系统 、 辅 助 决策 系统 。 

2) 分 别 对 营销 系统 的 报表 系统 、 辅 助 决策 系统 进行 说 明 。 例 如 ， 报 表 系 统 可 以 分 成 管理 
类 、 稼 销 监控 类 、 客 服 类 、 客 户 关 系 类 、 缴 费 类 等 儿 个 部 分 。 同 时 需要 说 明报 表 系 统 的 数据 
存储 方式 ， 数 据 展示 的 层次 关系 ， 报 表 的 管理 流程 ， 报 表 的 功能 需求 等 内 容 。 而 辅助 决策 系 
统 需要 说 明 的 是 按照 业务 主题 划分 ， 可 以 将 需求 分 成 儿 个 部 分 。 例 如 ， 和 营销 辅助 决策 系统 可 
以 分 成 以 下 儿 个 业务 主题 : 营销 绩效 主题 、 客 户 服务 主题 等 。 其 中 营销 绩效 主题 可 以 查询 公 
司 的 主要 经 营 绩效 情况 ， 查 询 项 可 以 是 销售 量 、 销 售 均 价 、 市 场 占有 率 等 ， 同 时 需要 对 每 个 
指标 项 进行 说 明 。 

3) 对 系统 运行 环境 的 说 明 。 系 统 运行 环境 包括 系统 的 架构 、 系 统 的 硬件 设备 及 其 软件 等 
内 容 。 例 如 ， 和 营销 辅助 决策 系统 的 架构 如 网 14-7 所 示 。 


















































业务 应 用 系统 


数据 集 市 


数据 仓库 


ODS 统一 信息 视图 区 


| | 1 系统 源 数 据 


营销 
We 





图 14-7 "EAE ARRIUS 
其 中 ODS 统一 信息 视图 区 是 达 销 辅助 决 集 系 统 文 持 决 集 分 析 , 并 且 你 证 数据 正确 性 的 存 
储 缓 冲 区 。 该 缓冲 区 和 面 加 的 是 宵 销 系统 源 数 据 第 一 次 ETL 的 过 程 ， 并 且 按 照 东 种 统一 的 规范 
为 该 应 用 系统 提供 数据 支持 。 
数据 仓库 是 根据 主题 域 的 划分 ， 对 历史 数据 的 集中 整合 和 存储 ， 同 时 数据 仓库 也 会 控 照 
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某 种 频率 进行 定期 的 数据 更 狐 ， 为 数据 展示 提供 文 持 。 数 据 集 市 是 在 数据 仓库 的 基础 上 按照 
星 型 结构 或 者 雪花 型 结构 进行 数据 建 模 ， 是 报表 展示 的 基础 ， 为 营销 辅助 决策 系统 提供 各 种 
角度 的 数据 分 析 。 

系统 的 硬件 设备 说 明 见 图 表 14-2. 








表 14-2 系统 的 硬件 设备 说 明 

















便 件 设备 名 称 说 HH 

营销 系统 ODS 数据 库 可 以 使 用 Oracle 10g， 同 时 为 了 实现 高 可 用 性 ， 并且 达 到 负载 均衡 的 标准 ， 可 以 采用 
服务 器 两 台 机 器 集群 的 形式 

营销 系统 ETL 数据 仓库 和 ETL 工具 运行 在 不 同 的 服务 器 中 ， 同 时 为 了 保证 系统 的 正常 运行 ， 需 要 采用 两 


服务 器 、 数 据 仓库 服务 器 | 台 服 务 器 互相 进行 热 备 份 的 机 制 

BI 展示 和 应 用 系统 运行 在 不 同 的 服务 器 中 ， 同 时 为 了 保证 系统 的 正常 运行 ， 需 要 采用 两 台 
服务 器 互相 进行 热 备份 的 机 制 。 如 果 一 台 服 务 器 发 生 故 隐 不 能 正常 运行 ， 则 需要 切换 到 另外 
一 合 服务 磊 中 运行 





报表 展示 服务 器 和 应 用 系 
统 服务 器 





软件 列表 见 表 14-3。 


表 14-3 软件 列表 


软件 名 称 说 明 
ODS 统一 信息 视图 区 使 用 Oracle 10g 作为 ODS 统一 信息 视图 区 的 数据 库 管 理 系统 
数据 仓库 、 数 据 集 市 使 用 Oracle 10g 作为 数据 仓库 、 数 据 集 市 的 数据 库 管理 系统 
ETL 工具 使 用 Informatica PowerCenter 作为 ETL 的 工具 
BI 软件 使 用 Cognos 8 作为 BI 展现 工具 
Web 应 用 服务 器 采用 BEA WebLogic Server 作为 Web 应 用 服务 器 


14.2.2 ”功能 需求 


营销 系统 以 销售 窟 理 柑 块 为 核心 ， 包 括 达 销 官 理 模块 、 客 性 服务 模块 、 市 场 管 理 模 块 、 
客户 关系 模块 、 和 营销 辅助 决 梨 分 析 模 块 等 。 以 营销 辅助 决策 分 析 模 其 为 例 ， 该 模块 是 营销 系 
统 最 高 层次 的 应 用 ， 通 过 对 香 销 数据 的 分 机 、 挖 据 ， 使 企业 管理 层 人 员 及 时 了 解 营销 业务 的 
发展 情 况 ， 包 括 各 种 指标 的 完成 情况 ， 为 企业 的 发 展 决 宁 提供 帮助 。 

营销 辅助 决策 的 功能 需求 包括 萌 销 系统 的 绩效 得 询 ， 见 表 14-4。 该 系统 可 以 通过 各 种 网 
形 〈 饼 形 图 、 柱 形 图 、 仪 表盘 等 形式 ) 、 表 格 、 文 子 等 方式 实现 对 营销 业务 的 分 析 与 预测 ， 
促进 管理 屋 人 员 对 其 经 营 状 况 的 了 解 ， 为 其 相关 经 营 政 朱 的 制定 提供 帮助 。 


表 14-4 功能 需求 概述 
.销售 额 
.利润 
费用 
. 市场 占有 率 
.营业 户 数 
.累计 销售 量 
































p< 


营销 系统 的 绩效 但 询 





营销 系统 的 绩效 查询 销售 完成 情况 


Om| 人 | WW | 
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7. 销售 收入 
营销 系统 的 绩效 查询 销售 市 场 管理 8. 解决 客户 投诉 率 
9. 销售 合同 率 





用 柱 形 图 和 人 饼 形 图 的 形式 实现 对 绩效 指标 的 分 析 ， 如 图 14-8 和 图 14-9 所 示 。 
绩效 指标 的 分 析 





u 销售 额 wg ud 
图 14-8 柱 形 图 





"n 销售 额 
国 1 月 4A 1A 
B? H 27% 24% 
B3 月 






3H 


m4 月 25% 





图 14-9 ”人 饼 形 图 


(1) 经 营 绩效 的 分 析 

按照 时 间 月 份 分 析 经 营 绩 效 明细 情况 ， 包 括 铀 售 向 、 利 润 、 费 用 、 市 场 占有 率 等 指标 。 
(2) 销售 完成 情况 的 分 析 

按照 时 间 月 份 分 析 销 售 完成 明细 情况 ， 包 括 营 业 户 数 、 累 计 销 售 量 等 指标 。 

(35 销售 市 场 管理 的 分 析 

按照 时 间 月 份 分 析 销 售 市 场 管理 情况 明细 ,包括 销售 收入 、 解 决 客户 投诉 率 、 销 售 合同 率 。 
各 项 指标 说 明 见 表 14-5. 

















表 14-5 指标 说 明 


TT 





销售 额 销售 额 = 销 售 量 x* 平 均 销 售 价格 
利润 利润 = 收入 -费用 
费用 企业 在 日 第 活动 中 所 消耗 的 经 济 利益 文 出 








TARAX 指 一 个 企业 的 销售 量 在 市 场 同 类 产品 中 的 比重 


165 


(BE) 
名 称 指标 说 明 
营业 户 数 统计 期 内 按 某 种 分 类 统计 的 户 数 
蛇 计 销售 量 本 年 统计 期 内 销售 量 的 合计 
销售 收入 销售 收入 三 产品 销售 数量 x 产品 单价 





客 己 投诉 率 客户 投诉 率 = 客 户 投 诉 次 数 /企业 服务 客户 的 总 次 数 
销售 合同 率 销售 合同 率 = 签订 合同 的 数量 /总 的 销售 合同 数量 


14.3 ”营销 系统 设计 


14.3.4 ”总体 架构 设计 
营销 辅助 决策 系统 架构 设计 如 图 14-10 PTR. 


ODS ”数据 仓库 





图 14-10 ” 宫 销 辅助 决策 系统 架构 设计 


(1) 应 用 架构 

应 用 架构 是 指 业 务 数 据 和 业务 系统 之 间 的 关系 。 本 书 重 点 摘 述 的 是 数据 仓库 的 应 用 ， 所 
以 业务 应 用 系统 的 设计 不 属于 本 书 范围 。 

(2) 数据 仓库 -数据 访问 架构 

数据 仓库 -数据 访问 架构 是 指数 据 仓 库 在 运行 时 的 各 个 流程 和 状态 ， 主 要 包括 ODS、 数 
据 仓 库 、 数 据 集 市 、 商 业 智 能 数据 分 析 应 用 ， 如 图 14-11 所 示 。 

(3) 运 维 管理 

运 维 管理 主要 包括 数据 的 备份 与 恢复 、 系 统 的 监控 、 性 能 的 管理 等 内 容 。 
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图 14-11 ”数据 仓库 -数据 访问 淋 构 图 


14.3.2 ”营销 辅助 决策 系统 的 ETL 架 构 设计 
ETL 架构 设计 主要 包括 抽取 、 清 洗 、 转 换 、 加 载 4 个 部 分 ， 如 图 14-12 所 示 。 
数据 源 





图 14-12 ETL 架构 设计 图 





其 中 抽取 主要 负责 将 营销 辅助 决策 系统 的 业务 源 数 据 提 取 到 数据 仓库 中 ， 业 务 源 数据 可 
以 是 关系 型 数据 库 ， 也 可 以 是 各 种 文件 ， 例 如 xml 文件 、Excel 文件 、 文 本 文件 等 。 因 为 不 同 
业务 源 数 据 的 数据 质量 可 能 各 个 相同， 所 以 每 个 数据 源 的 抽取 方式 也 有 所 不 同 ， 它 们 都 需要 
建立 各 目 独 立 的 抽取 程序 ， 然 后 通过 通用 的 接口 将 源 数据 抽取 到 清洗 步骤 中 去 。 

抽取 步骤 主要 包括 对 数据 适 配 左 的 文 持 ， 使 得 抽取 程序 可 以 与 多 种 业务 数据 源 相 连接 。 
一 般 来 说 ， 源 数据 适配器 包含 对 JDBC、ODBC、XML 等 方式 的 支持 ， 为 两 端的 数据 交换 提 
供 最 基本 的 条 件 。 

消 洗 步 又 主要 是 针对 数据 仓库 要 求 的 数据 质量 标准 ， 对 营销 数据 进行 清洗 的 过 程 。 对 到 
销 数 据 消 洗 的 方法 可 以 有 两 类 。 

D 专用 的 请 洗 程 序 ， 目 的 是 针对 不 同 的 业务 系统 有 不 同 的 请 洗 程 序 。 

2) 通用 的 清洗 程序 ， 如 果 每 个 业务 源 系 统 的 清洗 规则 相同 ， 可 以 使 用 目 定 义 的 通用 函数 
来 满足 各 个 业务 源 系 统 的 清洗 程序 。 清 洗 工 作 的 主要 任务 是 对 业务 源 数 据 的 解析 、 数 据 标 准 
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化 和 数据 合并 的 过 程 。 

转换 步骤 主要 负责 在 业务 源 数据 加 载 到 数据 仓库 之 前 的 最 后 一 次 修改 。 许 多 聚合 的 操作 
和 对 指标 的 计算 都 在 这 一 步骤 中 完成 。 

加 载 步骤 是 将 吾 销 业务 源 数据 加 载 到 目标 数据 络 构 中 。 这 些 目标 数据 结构 可 以 是 事实 
表 ， 也 可 以 是 维度 表 ， 这 是 ETL 过 程 的 最 后 一 步 。 


14.3.3 “营销 辅助 决策 系统 数据 访问 功能 设计 


数据 访问 功能 主要 包括 : 报表 展示 功能 、 即 席 查询 。 _4 
功能 、 联 机 分 析 处 理 功能 、 预 测 分 析 功能 ， 如 图 14-13 — (S2 


数据 访 ( 即席 查 
aae A 问 功能 JDE A 
所 不 。 £g ` r| 


报表 展示 功能 一 般 从 数据 仓库 或 者 数据 集 市 中 读 取 r 






















数据 ， 用 以 实现 自 定义 或 者 预定 义 的 展示 功能 。 使 用 报 Ww TS. 
表 展示 功能 的 用 户 一 般 都 是 企业 的 高 层 领导 人 员 、 数 据 Vy 
分 析 人 员 、 业 务 人 员 等 。 

即席 查询 功能 是 对 相关 业务 准 实时 性 的 查询 。 一 般 图 14-13 数据 访问 功能 


此 功能 是 提供 给 高 级 数据 分 机 人 员 使 用 的 。 

联机 分 析 处 理 COLAPO 功能 是 通过 对 各 销 辅助 决 生 系 统 业 务 数据 的 多 维 分 机 和 各 种 几 表 
的 展示 ， 以 实现 业务 数据 的 分 析 功 能 。 

预测 分 析 功 能 古 通 过 数据 挖 抉 等 统计 分 析 搁 术 ， 利 用 数据 源 中 有 价值 的 数据 建立 起 来 的 
信息 系统 ， 为 用 尸 提供 了 预测 与 分 析 的 功能 ， 这 也 体现 了 商业 智能 的 价值 。 


14.3.4 ”营销 辅助 决策 系统 展示 方式 设计 


CD 雷达 图 

雷达 图 主要 用 于 表示 当前 经 营 绩效 明细 情况 。 该 图 显示 了 各 组 数据 值 偏离 数据 原点 的 距 
离 ， 如 图 14-14 所 示 。 

(2) 柱 形 图 

柱 形 图 主要 用 于 表示 当前 经 营 绩效 明细 情况 。 该 图 显示 了 不 同月 份 、 不 同 数 据 项 之 间 的 
比较 ， 如 图 14-15 所 示 。 



































2011-6-1 | 是 销售 额 

so i 利润 

4 — 销售 额 | ! 
2011-10-1 « © 2011-7-1 利润 | M 费用 

'\ —— u 市场 占有 率 
一 费用 | 
MN Jj — 市 场 占 有 率 
2011-9-1 * 2011-8-1 
图 14-14 雷达 图 图 14-15 柱 形 图 
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(3) 折线 图 

折线 图 主要 用 于 表示 当前 经 营 绩 效 明细 情况 的 数据 变化 趋势 ， 如 图 14-16 所 示 。 

(4) 饼 形 图 

饼 形 向 主 要 用 于 显示 当前 经 营 绩效 明细 情况 的 数据 相对 于 总 数值 的 大 小 和 所 占 比 重 ， 如 
图 14-17 所 示 。 























"E RE | 一 销售 额 销售 额 
ee = Jii 
| 一 一 了 | =m B 2011-6-1 


10 S | ——| —| 费用 lil 2011-7-1 
0 4 — | 一 市 场 占有 率 id 2011-8-1 
N o S ^ 
I ^ CO Ow S il 2011-9-1 


D" 
; 2S lil 2011-10-1 


图 14-16 折线 图 图 14-17 人 饼 形 图 


(5) 面积 图 

面积 图 主要 用 于 显示 当前 经 营 绩效 明细 情况 的 每 一 数值 所 占 大 小 ， 随 时 间或 者 其 他 类 别 
而 变化 的 曲线 ， 如 图 14-18 所 示 。 

(6) 条 形 图 

条 形 图 主要 用 于 显示 当前 经 营 绩 效 明 细 情 况 数 据 间 的 比较 , 数据 平行 的 演示 , 如 图 14-19 
所 示 。 


















































2011-9-1 | 
u 销售 额 2011-8-1 (| 
l 利润 - E 市 场 占有 率 
ups 2011-7-1 | Bum 
$ eZ = 一 M 市 场 占有 率 2011-6-1 | E fui 
8 EZ 2 3 — | mym 
(058 R 100 
图 14-18 面积 图 14-19 条 形 图 
14.3.5 ”营销 辅助 决策 系统 主题 分 析 功 能 设计 
下 面 举例 如 下 : 
销售 分 析 是 指 在 指定 时 间 范 围 内 ， 分 析 市 场 占 有 率 、 费 用 、 利 泗 、 销 售 额 等 指标 ， 其 主 
要 分 析 内 容 如 下 : 





(1) 不 同 地 区 销售 情况 分 析 与 预测 
按照 相同 时 间 范 围 内 、 不 同 的 地 区 范围 去 分 析 市 场 扣 有 率 、 寓 用 、 利 油 、 销 售 额 的 统计 
分 析 和 同期 对 比分 析 。 
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(2) 不 同 产品 类 型 销售 情况 分 析 与 预测 
按照 相同 时 间 范 围 内 、 不 同 的 产品 类 型 去 分 析 市 场 占有 率 、 费 用 、 利 润 、 销 售 额 的 统计 
分 析 和 同期 对 比分 析 。 


14.3.6 ”数据 模型 设计 


1. 企业 模型 和 企业 数据 模型 的 定义 和 关系 

企业 模型 主要 描述 的 是 企业 结构 和 企业 业务 活动 : 而 企业 数据 模型 是 对 企业 业务 活动 的 
抽象 ， 通 过 数据 建 模 的 方法 描述 企业 业务 的 主要 活动 和 各 种 经 营 过 程 。 企 业 数 据 模型 是 在 企 
业 模 型 的 基础 上 建立 起 来 的 ， 主 要 用 于 支持 辅助 决策 系统 中 ODS 模型 、 数 据 仓 库 模 型 、 数 据 
集 市 模型 的 建设 ， 是 企业 信息 化 的 基础 。 

2. 企业 数据 模型 建设 的 意义 和 内 容 

企业 数据 模型 建设 的 意义 有 以 下 儿 个 方面 ， 如 图 14-20 所 示 。 

1) 企业 数据 模型 的 建设 有 利于 定义 企业 业务 活动 和 经 营 过 程 中 过 到 的 基本 概念 和 主要 内 
容 ， 是 企业 信息 化 建设 的 第 一 步 。 

2) 企业 数据 模型 的 建设 有 利于 将 业务 数据 转化 成 有 价值 的 信息 和 知识 。 

3) 企业 数据 模型 的 建设 是 构建 ODS 模型 、 数 据 仓库 模型 、 数 据 集 市 模型 的 基础 。 

4) 企业 数据 模型 的 建设 是 企业 管理 者 、 业 务 人 员 和 设计 开发 人 员 沟 通 的 基础 ， 有 利于 提 
高 辅助 决策 系统 开发 的 效率 。 

企业 数据 模型 的 内 容 主 要 分 为 : 概念 模型 设计 、 逻 辑 模型 设计 、 物 理 模 型 设计 。 

CD 概念 模型 设计 

1) 企业 数据 概念 模型 设计 主要 包括 主题 域 的 设计 、 主 题 与 实体 的 设计 。 一般 情 况 下 ， 主 
题 域 包 含 一 个 或 者 多 个 主题 ， 每 个 主题 的 最 小 单位 就 是 实体 。 例 如 在 图 14-21 中 ， 销 售 分 析 
主题 域 包含 地 区 销售 情况 分 析 与 了 预测 主题 ， 访 主题 义 包 含 销售 人 员 实 体 。 




















































销售 分 析 
主题 域 


地 区 销售 情 
况 分 析 与 预 
MEM 


定义 企业 业务 活动 的 基本 概念 和 主要 内 容 





将 业务 数据 转化 成 有 价值 的 信息 和 知识 


上 ” 


是 构建 ODS 模型 、 数 据 仓库 模 型 、 数 据 集 市 模型 的 基础 


~ 0j 





是 企业 管理 者 、 业 务 人 员 和 设计 开发 人 员 沟通 的 平台 


E AE Il B RE 





图 14-20 ”企业 数据 模型 建设 的 意义 图 14-21 企业 数据 概念 模型 设计 举例 


2) 概念 模型 建设 的 依据 : 包含 企业 模型 、 现 有 的 应 用 系统 和 其 他 领域 的 经 验 , 如 图 14-22 
所 示 。 

3) 概念 模型 建设 的 步骤 : 通过 分 析 业 务 系 统 的 主要 数据 ， 结 合 业务 之 间 的 关系 列 出 详细 
的 数据 主题 ， 在 此 基础 上 ， 根 据 数据 主题 之 间 的 逻辑 关系 ， 将 其 划分 到 各 上 自 所 属 的 数据 主题 
域 中 ， 最 后 形成 企业 级 主题 域 概念 模型 。 概 念 模型 建设 的 步骤 如 图 14-23 所 示 。 
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现 有 的 应 












用 系统 
"M | 其 他 领域 Aid 
企业 模型 M a er: - ; "m , 
cuv 时 | 的 经 验 分 析 业 || 列 出 数 rs 
` E— i- 务 系 统 据 主题 今 gi "i 
HAH 
| 型 建设 


的 依据 





图 14-22 ”概念 模型 建设 的 依据 图 14-23 ”概念 模型 建设 的 步骤 


下 面 以 吾 销 系统 为 例 进 行 介绍 。 根 据 营 销 系统 业务 和 经 营 活 动 的 特点 ， 列 出 下 面 的 部 分 
数据 主题 ， 见 表 14-6。 


表 14-6 营销 系统 的 数据 主题 

















数据 主题 数据 主题 说 明 
产品 基本 信息 主要 描述 企业 提供 产品 的 基本 情况 信息 和 各 种 服务 信息 
产品 价格 对 产品 价格 的 描述 
教育 背景 对 企业 员工 教育 背景 的 描述 
职位 信息 对 企业 员工 工作 职位 的 描述 
人 员 基 本 信息 主要 描述 人 员 的 基本 信息 ， 包 括 人 员 的 教育 背景 、 性 别 、 姓 名 、 家 庭 收 入 等 
社会 保险 信息 对 各 种 社会 保险 的 定义 
产品 质量 信息 对 各 种 产品 质量 的 描述 
业绩 信息 对 工作 业绩 的 描述 
社会 关系 信息 对 企业 员工 基本 社会 关系 的 描述 


根据 数据 主题 之 间 的 逻辑 关系 ， 可 以 划分 成 以 下 几 个 数据 主题 域 ， 人 员 主 题 域 、 产 品 主 
题 域 和 市 场 主题 域 ， 见 表 14-7。 


X 14-7 营销 系统 的 数据 主题 域 

















主题 域 jo ” XX 

— 主要 描述 企业 经 营 活 动 中 产生 的 人 员 基 本 信息 ， 包 括 企业 的 内 部 人 员 信息 和 与 企业 相关 的 其 他 人 员 
人 员 主题 域 的 信 自 
产品 主题 域 主要 描述 企业 提供 的 产品 信息 和 各 种 服务 信息 
市 场 主题 域 主要 描述 企业 与 外 部 组 织 进行 商品 交易 时 所 产生 的 市 场 信息 








下 面 以 人 员 主 题 域 为 例 进 行 介绍 。 人 员 主 题 域 包含 教育 背景 信息 、 人 员 职 务 信息 、 人 员 
工作 业绩 信息 、 人 员 社 会 保险 信息 、 人 员 社 会 关系 信息 ， 如 图 14-24 所 示 。 

(2) 进 辑 模型 设计 

逻辑 数据 模型 是 对 概念 模型 的 分 解 和 细 化 ， 主 要 描述 了 实体 、 属 性 、 实 体 和 实体 之 间 的 
关系 等 内 容 。 实 体 通 常 是 企业 经 营 活动 中 的 一 个 事件 、 一 个 概念 、 一 个 日 常 的 业务 活动 或 者 
是 一 个 参与 者 。 属 性 是 描述 实体 相关 特性 和 定义 的 信息 。 关 系 是 描述 实体 和 实体 之 间 的 业务 
规则 或 者 关联 关系 。 下 面 以 部 分 营销 系统 逻辑 模型 为 例 ， 摘 述 逻 辑 数据 模型 的 特点 。 例 如 在 
图 14-25 中 ， 用 户 基本 信息 包含 购买 商品 价格 信息 、 用 户 地 址 信息 、 用 户 应 收费 用 和 用 户 账 


























171 


单 信 息 。 





人 员 职 务 
信息 


图 14-24 人 员 主 题 域 





人 员工 作 
业绩 信息 








购买 商品 价格 信息 | BL 











:elationship. 6 ielatlonship 5 





用 户 基本 信息 








ielationship 4 Xelationship_7 





用 户 应 收费 用 | ”用户 账单 信息 
| 


| 


图 14-25 逻辑 模型 设计 

















(3) 物理 模型 设计 

物理 数据 模型 主要 描述 了 模型 实体 数据 存储 方面 的 内 容 。 在 设计 的 时 候 ， 需 要 考 夸 数据 
的 闫 型 、 长 度 和 索引 结构 。 除 此 之 外 ， 还 需要 孝 碟 数据 存储 的 性 能 问题 和 数据 库 产 品 的 特点 。 
下 面 以 部 分 营销 系统 物理 模型 为 例 ， 描 述 物理 模型 的 特 点 。 例 如 在 图 14-26 H, EMRA 
含 用 户 信 息 表 、 职 务 类 型 编码 表 、 商 品类 型 编码 表 、 用 户 地 址 编码 表 。 

3. 企业 数据 模型 与 其 他 模型 的 关系 

企业 数据 模型 是 从 企业 的 整体 角度 来 描述 企业 的 信息 化 建设 ,是 构建 ODS 数据 模型 、 数 
据 仓 库 数据 模型 、 数 据 集 市 数据 模型 的 基础 。 

企业 数据 模型 与 其 他 模型 的 天 系 如 图 14-27 所 示 。 

4. ODS 数 据 模型 建设 

ODS 统一 信息 视图 区 的 概念 模型 是 依据 企业 数据 模型 构建 的 ， 它 是 按照 主题 进行 规划 组 
织 的 ， 一 般 来 次 ， 都 是 最 近 时 间 的 或 者 实时 的 数据 存储 ， 使 用 户 能 够 快速 得 询 数据 。ODS 统 
一 信息 视图 区 需要 满足 两 个 条 件 : 一 是 满足 各 个 部 门 和 组 织 对 数据 共 孚 的 要 求 ， 二 是 满足 实 
时 性 获取 数据 的 要 求 。 
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和 实体 之 间 关 系 的 定义 。 

在 ODS 存储 区 中 只 保存 最 新 的 数据 ， 并 且 不 断 删 除 旧 数据 。 

大 小 直接 决定 了 数据 量 的 大 小 和 查询 的 灵活 性 ， 是 逻辑 设计 中 重点 要 
解决 的 一 个 问题 。 


参考 业务 系统 的 原 模型 ， 根 据 需 求 调研 的 结果 划 定 主要 的 数据 主题 范 
， 在 数据 主题 的 基础 上 进行 各 个 主题 的 定义 。 


职务 类 型 编码 表 商品 类 型 编码 表 


职务 编码 varchar(20) 《pky> 商品 类 型 编码 rarchar(20) «pk»? 
职务 名 称 varchar (20) 商品 类 型 名 称 varchar (20) 





t 用 户 信息 表 _REFERENCE_ 用户 信息 未 _REFERENCE_ 商 品 关 型 编码 5 





C 用 户 信息 表 _REFFRENCE 用 户 地 址 编码 


用 户 地 址 编码 表 


用 户 地 址 编码 varchar (20) 
用 户 地 址 名 称 varchar (400) 





图 14-26 ”物理 模型 设计 


企业 数据 模型 


ODS 数据 模型 、 数 据 仓库 数据 模型 、 数 据 集 市 数据 模型 








图 14-27 企业 数据 模型 与 其 他 模型 的 关系 





ODS 逻辑 模型 设计 是 针对 逻辑 层 进行 设计 ， 主 要 包括 逻辑 结构 的 设计 、 存 储 周 期 的 设计 


和 存储 粒度 的 设计 。 


1) ODS 滥 辑 结构 设计 主要 包括 : 实体 和 实体 属性 的 定义 、 实 体 


2) 存储 周期 的 设计 主要 是 针对 数据 存储 期 限 的 定义 。 一般 来 说 ， 











3) 存储 粒度 的 设计 主要 是 对 数据 细节 程度 大 小 的 定义 ， 粒 度 的 








ODS 逻辑 模型 设计 的 一 般 步 又 如 图 14-28 所 示 。 
1) 根据 业务 系统 的 调研 结果 ， 划 分 ODS 的 主题 。 设 计 人 员 需 要 


2) 在 主题 定义 完成 之 后 ， 开 始 进行 实体 、 实 体 属性 、 实 体 和 实 








对 ODS 进行 主题 
的 划分 


定义 实体 、 实 体 
属性 和 实体 之 间 
的 关系 


形成 最 终 的 ODS 


逻辑 结构 说 明 书 





图 14-28 ODS 逻辑 模型 


设计 的 一 般 步 又 
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体 之 则 关系 、 数 据 的 存储 粒度 和 存储 周期 的 定义 。 在 此 基础 上 ， 需 要 你 证 所 有 实体 的 唯一 性 。 

3) 形成 ODS 饮 辑 结构 说 明 书 。 根 据 以 上 的 步骤 ， 在 ODS 好 辑 结 构 说 明 书 中 对 业务 需 
求 、 数 据 主 题 的 范围 、 主 题 的 定义 、 实 体 、 实 体 的 属性 、 实 体 和 实体 之 间 的 关系 进行 详细 的 
说 明和 解释 。 

ODS 逻辑 模型 设计 的 原则 如 下 : 

D 以 侣 销 系 统 为 例 ， 几 是 涉及 袁 销 系统 使 用 其 他 系统 的 数据 ， 都 应 该 将 该 系统 的 实体 放 
入 ODS 好 辑 模型 中 。 例 如 ， 始 销 系 统 使 用 人 人 力 资源 系统 和 商品 交易 系统 作为 稳定 的 数据 源 ， 
则 将 人 力 资源 和 商品 交易 系 统 的 实体 放 入 到 营销 辅助 决策 系统 的 ODS 逻辑 模型 中 。 有 反之， 如 
果 人 力 资 源 系统 和 商品 交易 系统 都 使 用 营销 系统 作为 稳定 的 数据 源 ， 则 不 需要 将 人 力 资源 和 
商品 交易 系统 的 实体 放 入 营销 辅助 决 俩 系统 的 ODS 逻辑 模型 中 。 

2) 外 部 业务 系统 的 基础 数据 一 般 不 放 入 











ODS 逻辑 模型 中 。 例 如 ， 其 他 商品 的 生产 信息 作 
为 生产 系统 的 基础 数据 ， 但 是 不 放 入 营销 系统 的 | 商品 类 型 编码 varchar2(200) 《pk> 
型 名 称 varchar2(200) 


ODS 人 逻辑 模型 中 。 

3) 营销 辅助 决策 系统 涉及 的 各 个 主题 域 中 
共享 的 编码 实体 ， 一 般 都 放 入 ODS 逻辑 模型 中 。 
例如 ， 营 销 辅助 决策 系统 中 的 商品 类 型 编码 实体 
放 入 ODS 逻辑 模型 中 ， 如 图 14-29 所 示 。 

ODS 逻辑 模型 设计 的 原则 如 图 14-30 所 示 。 








图 14-29 A ODS 逻辑 模型 中 的 编码 实体 


"E 








/营销 系统 使 用 
其 他 系统 的 数 
人 据 ， 都 将 该 系 
统 的 实体 放 入 
到 ODS 逻辑 


P Q-— 








^ . ODS i? fiit 
| 模型 设计 














一 一 的 原则 | 
NM 外 部 业务 系统 
\ 入 到 ODS 逻辑 | 的 基础 数据 一 
模型 中 / 般 不 放 人 ODS 

E" 2 逻辑 模型 中 


图 14-30 ODS 逻辑 模型 设计 的 原则 


ODS 物理 模型 设计 主要 是 针对 ODS 数据 模型 的 物理 实现 进行 设计 ， 主 要 包括 数据 的 存 
储 结构 、 索 引 方 式 等 内 容 。 


174 





ODS 物理 模型 设计 的 步骤 如 下 : 

1) 确定 数据 的 存储 结构 。 

2) 确定 数据 的 抽取 频率 ， 数 据 量 的 大 小 和 响应 时 间 ， 这 些 信息 是 优化 的 重要 依据 。 

3) 确定 数据 优化 的 方式 : 例如 索引 策略 、 分 区 。 

5. 数据 仓库 数据 模型 建设 

数据 仓库 概念 模型 的 主要 功能 就 是 确定 用 户 决策 分 析 涉 及 的 所 有 问题 和 信息 。 例 如 ， 在 
进行 销售 情况 分 析 时 ， 可 以 根据 销售 的 时 间 、 地 区 范围 、 产 品类 型 等 分 析 各 个 指标 。 数 据 仓 
库 模 型 可 以 分 成 企业 的 核心 历史 数据 区 域 和 轻 度 汇总 数据 区 域 两 个 部 分 。 其 中 ， 企 业 的 核心 
历史 数据 区 域 主要 包括 主题 域 、 主 题 、 实 体 ， 以 及 实体 与 实体 之 间 的 关系 ， 同 时 为 了 实现 历 
史 数 据 的 保存 ， 每 个 实体 需要 有 一 个 时 间 惟 。 轻 度 汇 总 数据 区 域 是 根据 决策 分 析 的 需求 ， 制 
定 相 应 的 汇总 策略 ， 以 满足 用 户 的 需要 。 

数据 仓库 逻辑 模型 主要 是 针对 逻辑 层 进 行 设 计 ， 主 要 包括 主题 域 设 计 、 主 题 设 计 等 内 
fis 

数据 仓库 逻辑 模型 设计 的 主要 工作 有 : 

1) 确定 主题 域 和 每 个 主题 域 有 哪些 主题 。 

2) 确定 粒度 的 层次 划分 。 

3) 确定 数据 的 存储 周期 。 

部 分 营销 系统 数据 仓库 逻辑 模型 实例 如 图 14-31 所 示 。 

















职务 类 别 编 码 表 商品 类 别 编 码 表 


职务 类 别 编 码 pi» varchar2(20) «XN» 商品 类 别 编 码 pi» varchar2(20) «XN» 
职务 类 别名 称 varchar2(400) 品类 别 和 名称 varchar2(400) 


Identifier 1 <pi> Identifier 1 <pi> 





aelationship_8 aelationship 9 


N A 
用 户 基 本 信息 表 


《pi> varchar2(20) XN» 





varchar2 (400) 
varchar2(20) 
varchar2(20) 


varchar2(20) 
umber 


Ap 
el ationship 1C 


用 户 购买 商品 汇总 信息 表 
年 月 《pi> varchar2(20) XN» 
购买 商品 数量 Humber 


Identifier 1 <pi> 





图 14-31 数据 仓库 逻辑 模型 实例 


数据 仓库 物理 模型 设计 主要 是 针对 数据 仓库 的 物理 层 进 行 设计 ， 主 要 包括 数据 的 存储 结 
构 、 索 引 | 方式 等 内 容 。 数 据 仓 库 物理 模型 设计 的 步 又 与 ODS 物理 模型 的 设计 步 又 是 完全 相同 
的 ， 在 此 不 再 资 述 。 但 是 需要 强调 的 是 ， 因 为 数据 仓库 的 数据 量 一 般 是 巨大 的 ， 并 且 数 据 仓 

















I7) 











库 中 的 数据 一 般 是 不 更 新 的 ， 所 以 可 以 采用 复杂 的 索引 策略 ， 以 获得 最 优 的 数据 存储 和 得 询 
效率 ， 并 且 降 低 了 维护 索引 的 难度 。 部 分 营销 系统 数据 仓库 物理 模型 实例 如 图 14-32 所 示 。 








[TE E pv 职务 类 别 
商品 类 别 编 码 varchar2(20) «pk? 职务 编码 varchar2(20) pk» 


KmA IE varchar2(20) 职务 各 称 varchar2(200) 





(C 用 户 基 本 信息 REFERENCE K 用 户 基 本 信息 _REFERENCE 职务 光量 


用 户 基本 信息 


varchar2(20) <pk> 
编码 varchar2(20) <fk1> 
varchar2(20) <fk2> 


varchar2(20) 
varchar2(20) 





图 14-32 ”数据 仓库 物理 模型 实例 


6. 数据 集 市 数据 模型 建设 

数据 集 市 概念 模型 是 根据 业务 需求 建立 起 来 的 ， 它 可 以 包含 两 部 分 内 容 : 综合 类 的 分 析 
查询 和 专业 性 的 分 析 查 询 。 其 中 综合 类 的 分 析 查 询 是 根据 企业 的 整体 环境 ， 包 括 企 业 的 总 体 
战略 方针 和 指导 思想 ， 对 企业 的 主要 指标 进行 综合 分 析 和 预测 。 专 业 性 的 分 析 查 询 是 根据 不 
同 的 部 门 和 组 织 机 构 对 他 们 各 上 自 所 关心 的 指标 进行 分 析 和 查询 。 通 常数 据 集 市 的 数据 来 源 是 
数据 仓库 中 的 历史 数据 或 者 轻 度 汇总 数据 。 

通过 对 企业 的 需求 调研 ， 分 析 己 有 的 业务 报表 系统 和 企业 的 战略 分 析 目 标 ， 设 计 出 相应 
的 数据 集 市 模型 ， 见 表 14-8。 























表 14-8 对 企业 的 需求 调研 


分 析 主 题 销售 情况 分 析 
维度 时 间 、 地 区 范围 、 产 品类 型 
时 间 : 年 -月 -日 
维度 层次 地 区 范围 : 省 -地 市 
产品 类 型 : 食品 、 服 装 、 玩 具 、 家 电 
分 析 指 标 市 场 占有 率 、 费 用 、 利 润 、 销 售 额 
数据 来 源 营销 系统 
关注 对 象 公司 高 层 管理 人 员 部 门 管理 人 员 所 有 业务 人 员 
备注 信息 


数据 集 市 模型 如 图 14-33 所 示 。 
数据 集 市 逻辑 模型 主要 是 针对 逻辑 层 进行 设计 ， 主 要 包括 维 表 的 设计 、 事 实 表 的 设计 等 
内 容 。 
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销售 情况 事实 表 
市 场 占有 率 
费用 

利润 

销售 客 





图 14-33 ”数据 集 市 模型 


数据 集 市 的 主要 工作 有 : 
分 析 当 前 的 主题 域 ， 确 定 主题 域 下 面 有 哪些 主题 。 
2) 确定 粒度 的 层次 。 
3) 确定 事实 表 中 有 哪些 指标 。 
4) 确定 事实 表 中 关联 哪些 维度 。 
5) 确定 数据 集 市 的 关系 模式 ， 例 如 是 雪花 型 模式 还 是 星 型 模式 。 
维 表 设计 见 表 14-9 一 表 14-12。 

















表 14-9 时间 维 表 


Xxx 14-10 产品 类 型 


t o R 


A 


t BR 


P» 


X 14-11 地 区 维 表 
& om TIT um 
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A 14-312 销售 情况 事实 


数据 集 市 物理 模型 设计 主要 是 针对 数据 集 市 的 物理 层 进行 设计 ， 主 要 包括 数据 的 存储 结 
构 、 索 引 方 式 等 内 容 。 数 据 集 市 的 物理 模型 设计 步 怒 与 数据 仓库 物理 模型 的 设计 步 又 是 完 
相同 的 ， 在 此 不 再 次 述 。 但 是 需要 强调 的 是 ， 数 据 集 市 的 数据 量 相 对 较 大 ， 并 且 数 据 集 市 中 
的 数据 一 般 是 不 更 新 的 ， 所 以 可 以 采用 复杂 的 索引 策略 ， 以 获得 最 优 的 数据 存储 和 奏 询 效率 ， 
并 且 降 低 了 维护 索引 的 难度 。 

数据 集 市 物理 模型 实例 如 图 14-34 所 示 。 


b 


zizizi|i-«|-«|-«!|« 


Z 





























时 间 维 表 地 区 维 表 


varchar2(200) 《pk> 地 区 编码 varchar2(200) 《pk> 
时 间 名 称 varchar2(200) 地 区 和 名称 varchar2(200) 


zx_ 销售 情 讽 事 实 表 _REFERENCE_ 时 间 锥 站 情 况 事 实 表 _REFERENCE_ HEE Ea 


销售 情况 事实 表 


varchar2(200) 

varchar2(200) <fk2> 

varchar2(200) <fk1> 
码 varchar2(200) 《fk3> 

number 

number 

number 

number 





Sacre LE 





: SHE TIBULSE3EOXK REFERENCE 产品 类 型 维 ; 


产品 类 型 维 表 


产品 类 别 编 码 varchar2(200) 《pky> 


产品 类 别名 称 varchar2(200) 





图 14-34 ”数据 集 市 物理 模型 实例 


14.4 ETL 数据 抽取 


14.4.4 ”ETL 物理 设计 


PowerCenter Folder 的 划分 见 表 14-13 和 图 14-35. 
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表 14-13 PowerCenter Folder 的 划分 


从 源 数据 库 抽取 到 ODS 数据 缓冲 区 

2 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 
3 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 

4 Jii He lab RR 


由 |] MARKET | BLIFFER 
H-E MARKET | DM 
E-[7] MARKET | DW 

由 -多 MARKET | VIEW 


图 14-35 PowerCenter Folder 的 划分 


14.4.2 ”从 源 数 据 库 抽 取 到 ODS 数据 缓冲 区 
人 下面 以 用 己基 本 信息 表 《〈 见 表 14-14) 为 例 进行 介绍 。 








wo [sss — [meo wa | 
mom  [wxsaxwes [moro vw | — 


更 新 策略 : 采用 全 量 抽取 的 方式 ， 只 保留 最 新 的 数据 。 
14.4.8 ”从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 
从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 见 表 14-15. 














表 14-15 从 ODS 数据 缓冲 区 抽取 到 ODS 统一 信息 视图 区 
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C1) 抽取 策略 

每 月 定时 抽取 。 

(2) 更 新 策略 

第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 

(3) 抽取 的 方法 

D 全 量 抽取 : Select * from ODS 数据 缓冲 区 的 表 。 

2) 增 量 抽取 : where TO DATE (M Time,YYYYMM') >=TRUNC (ADD MONTHS 
(SYSDATE, -1), 'MM’). 


14.4.8 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 
从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 见 表 14-16。 











表 14-16 从 ODS 统一 信息 视图 区 抽取 到 数据 仓库 


C1) 抽取 策略 

每 月 定时 抽取 。 

(2) EIR 

第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 

(3) 抽取 的 方法 

1) 全 量 抽取 : Select * from ODS 统一 信息 视图 区 的 表 。 

2) 增 量 抽取 : where TO DATE(M Time, YYYYMM/--TRUNC(ADD MONTHS(SYSDATE, 
-1),MM'")。 


14.4.5 ”从 数据 仓库 抽取 到 数据 集 市 
从 数据 仓库 抽取 到 数据 集 市 多 表 14-17。 

















表 14-17 从 数据 仓库 抽取 到 数据 集 市 
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CIO 抽取 策略 

每 月 定时 抽取 。 

(2) EIR 

第 一 次 全 部 抽取 ， 以 后 抽取 的 都 是 最 近 一 个 月 的 数据 。 
(3) 抽取 的 方法 

1) 全 量 抽 取 : Select * from ”数据 仓库 的 表 。 


2) 增 量 抽取 : where TO DATE(M Time,YYYYMM")>=TRUNC(ADD MONTHS (SYSDATE, 
-1), MM), 








14.5 报表 展示 


1. 报表 一 饼 形 图 
了 商品 类 型 -商品 数量 饼 形 图 如 图 14-36 所 示 。 


商品 数量 


m 家 电 类 
m 食品 类 

服装 类 
m 家 居 类 





图 14-36 ”商品 类 型 -商品 数量 饼 形 图 


2. 报表 一 柱 形 图 
了 商品 类 型 -商品 数量 柱 形 图 如 图 14-37 所 示 。 
1600 一 
1400 + 
1200 4 
1000 















m 家 电 类 
800 m 食品 类 
600 m 服装 类 
400 十 





—- max 


| 月 2H 3 H 4 H 


图 14-37 ”商品 类 型 -商品 数量 柱 形 图 
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3. — 
了 商品 类 型 -商品 数量 折线 图 如 图 14-38 PZR. 


商品 类 型 -商品 数量 折线 图 
一 家 电 类 号 食品 类 -一 服装 类 一 家 居 类 


0 


eeo OOt 1300 


€-2:88— A A A A 280 
1H 2H 3H 4H 





图 14-38 商品 类 型 -商品 数量 折线 和 网 


14.6 ”编写 测试 报告 


测试 报告 主要 包括 以 下 几 个 部 分 。 

1. 编写 测试 概要 

根据 测试 计划 对 全 部 功能 进行 测试 ， 包 括 测试 的 结果 ， 是 否 如 期 完成 。 

2. 测试 的 环境 

(1) 便 件 环境 

人 硬件 环境 主要 描述 应 用 服务 器 的 配置 ， 数 据 库 服务 器 的 配置 ， 如 图 14-39 所 示 。 

(2) 系统 软件 环境 

系统 软件 环境 主要 描述 应 用 服务 器 和 数据 库 服务 器 所 在 的 系统 环境 ， 如 网 14-40 所 示 。 


e CPU: 8 : 。 应 用 服务 器 : 


Windows 2003SP3. 
e RAM: 16G : Weblogic 9.2 
: 5006 E 。 数据 库 服 务 器 : : 
SEE Windows 2003 SP3. 
Oracle 10g 





图 14-39 ”硬件 环境 图 14-40 ”系统 软件 环境 


测试 结果 分 析 
E 震 果 分 析 主 要 包括 用 例 编 号 、 测 试 项 、 测 试 子 项 、 功 能 点 、 输 入 数据 、 预 计 输 出 的 
言 息 、 测 试 结 果 和 对 问题 的 描述 ， 见 表 14-18 和 图 14-41. 





表 14-18 测试 结果 分 析 举 例 


TREE TT 


01 首页 月 报 页 面 显示 查看 页 面 显 显示 全 部 的 
IRETE 信息 
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CBE) 


mem 输入 数据 | 预计 输出 的 信息 | 测试 结果 “| 问题 描述 











X PE TE 显示 全 部 的 
02 首页 首页 月 报 
行 查 1 正确 


显示 全 部 的 











Ju 
03 首页 首页 月 报 全 有 仪表 二 


信 Es , 信 县 显示 
显示 是 否 正 常 


正确 
显示 全 部 的 




















04 SETETE | 信息 ， 信 息 显示 
正确 
(C r )—— 
TI | 
CC 
CC 
J 


预计 输出 的 傅 息 


测试 结果 


对 问题 的 描述 





图 14-41 测试 结果 分 析 


4， 对 问题 的 统计 
对 问 A HJ 完 计 包括 问 是 xe 分 类 让 cu 建议 )、 问题 状态 、 分 分 类 类 的 经 A VE. 小 计 、 总 
计 等 内 容 ， 见 表 14-19. 


表 14-19 对 问题 的 统计 


EK 


问题 的 分 类 问题 状态 分 类 的 统计 iF 
[wa [ a0 
ME 
oOo oma oos 
Oo owa ooa 
m: 21 
EL oOo o 
oOo owa oOo a o 
i I | 
测试 内 容 


测试 内 容 包 括 功能 模块 的 分 类 《〈 首 页 、 指 标 监 控 、 高 级 碍 询 )、 问 题 状态 、 分 闫 的 统计 、 





小 计 、 总 计 等 内 容 ， 见 表 14-20. 


表 14-20 测试 内 容 


功能 模块 的 分 类 分 类 的 统计 je w "mn 
首页 
指标 监控 i 
高 级 查询 3 


6. 测试 结论 

测试 结论 主要 摘 述 本 次 测试 是 侍 完 全 按照 测试 计划 和 测试 用 例 进 行 ， 主 要 测 出 了 哪些 问 
题 ， 问 题 主要 集中 在 哪个 部 分 ， 哪 些 问 题 仍 未 解决 ， 训 试 的 总 体 情 况 是 什么 ， 征 合 已 丝 达到 
了 测试 的 目的 每 内 容 。 














14.7 ”编写 用 户 手 册 





用 户 手 册 主 要 包括 以 下 几 个 部 分 。 

(1) 对 系统 的 概述 

首页 : 主要 包括 哪些 部 分 ， 有 哪些 分 析 功 能 。 

指标 监控 : 包括 哪些 指标 监控 专题 分 析 ， 例 如 工作 目标 执行 情况 分 析 。 

业务 专题 分 析 : 包括 哪些 业务 领域 的 专题 分 机 ， 例 如 人 力 资源 分 析 。 

局 层 领 导 但 询 : 主要 包括 企业 局 层 领 寻 关 注 的 但 询 内 容 有 哪些 ， 例 如 企业 单位 职工 情况 
4) T. 

高 级 分 析 : 主要 包括 系统 多 维 分 析 主 题 的 内 容 ， 
例如 人 员 信息 主题 分 析 等 。 

Tie trito: 主要 包括 根据 某 些 条 件 进 行 会 询 的 报表 。 

对 系统 的 概述 如 图 14-42 所 示 。 

(2) 用 户 使 用 说 明 

用 户 使 用 说 明 摘 述 用 户 如 何 登 录 a 到 系统 当中 ， 输 图 14-42. ”对 系统 的 概述 
入 的 网 址 是 什么 ;进入 到 系统 之 后 ， 如 何 进行 具体 的 
操作 ， 例 如 对 首页 、 指 标 监控 、 业 务 专 题 分 机 、 高 层 领导 答 询 、 避 级 分 机、 报表 得 询 等 内 容 
进行 操作 。 


14.8 软件 发 布 


软件 发 布 的 内 容 主要 包括 : 填写 系统 软件 的 名 称 ， 版 本 的 具体 信息 ， 对 发 布 的 说 明 《〈 系 
统 实现 了 哪 坚 主要 功能 )， 发 布 的 内 容 〈 主 要 是 源 代码 或 者 升级 包 )。 
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软件 发 布 还 包括 一 些 配置 项 和 非 配置 项 的 管理 ， 见 表 14-21 和 表 14-22. 


表 14-21 配置 管理 


表 14-22 非 配 置 项 管理 


Bn | 


14.9 ”系统 运行 维护 


N 


(1) 数据 库 管 理 系 统 

数据 库 系统 维护 内 容 主 要 包括 对 数据 库 参 数 的 维护 、 数 据 库 表 空间 的 维护 、 数 据 库 文 件 
的 维护 、 数 据 库 用 户 的 维护 等 内 容 。 

(2) 系统 故障 处 理 

当 数 据 库 文 件 损 坏 时 ， 应 该 首先 删除 数据 库 的 用 户 和 表 衬 间 ， 然 后 建立 新 的 用 户 和 对 应 
的 表 空 间 ， 最 后 根据 数据 库 的 日 志文 件 将 数据 库 文 件 恢复 。 

当 数 据 库 服务 器 中 的 便 件 出 现 故 障 时 ， 应 该 在 别 的 服务 器 中 建立 新 的 数据 库 ， 分 别 建 立 
数据 库 用 户 及 表 空 间 ， 将 数据 库 备 份 文件 恢复 到 新 的 服务 器 中 ， 以 保证 系统 正常 运行 。 























14.10 ”本 章 小 结 


D 项 目 工作 计划 的 制订 包括 : 对 项 目 痛 景 与 目的 的 接 述 、 确 定 项 目 需 要 交付 的 成 末 、 制 
定 项 目 党 理 文档 、 项 目 进度 划分 。 

2) 需求 分 析 包 括 : 业务 需求 概述 、 功 能 需求 概述 。 

3) 数据 访问 功能 主要 包括 : 报表 展示 功能 、 即 席 碍 询 功 能 、 联 机 分 析 处 理 功 能 、 预 测 分 
析 功 能 。 

4) 报表 展示 功能 一 般 从 数据 仓库 或 者 数据 集 市 中 读 取 数 据 ， 用 以 实现 日 定义 或 者 预定 义 
的 展示 功能 。 使 用 报 雪 展示 功能 的 用 户 一般 都 是 企业 的 高 层 领导 人 员 、 数 据 分 机 人员 、 业 务 
人 员 等 。 

5) 即席 查询 功能 是 对 业务 准 实时 性 的 查询 。 一 般 此 功能 是 提供 给 高 级 数据 分 析 人 员 所 使 
用 的 。 

6) 联机 分 析 处 理 COLAP) 功能 是 通过 对 索 销 辅助 决策 系统 业务 数据 进行 多 维 分 机 和 各 
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种 图 表 展 示 ， 以 实现 业务 人 员 对 数据 的 分 析 功 能 。 

7) 预测 分 析 马 能 是 通过 数据 挖 据 等 统计 分 析 技 术 ， 利 用 数据 源 中 有 价值 的 数据 建立 起 来 
的 信息 系统 ， 为 用 户 提 供 了 预测 与 分 析 的 功能 ， 这 也 体现 了 商业 智能 的 价值 。 

8) 企业 模型 主要 描述 的 是 企业 结构 和 企业 业务 活动 ， 而 企业 数据 模型 是 对 企业 业务 活动 
的 抽象 ， 通 过 数据 建 模 的 方法 描述 企业 业务 的 主要 活动 和 各 种 经 营 过 程 。 企 业 数 据 模 型 是 在 
企业 模型 的 基础 上 建立 起 来 的 ， 主 要 用 于 文 持 辅助 决 宁 系统 中 ODS 模型 、 数 据 仓 库 模型 、 数 
据 集 市 模型 的 建设 ， 是 企业 信息 化 的 基础 。 

9) 企业 数据 模型 的 内 容 主要 分 为 : 概念 模 型 设计 、 逆 辑 模 型 设计 、 物 理 模 型 设计 。 

10) 数据 仓库 模型 可 以 分 成 企业 的 核心 历史 数据 区 域 和 轻 度 汇总 数据 区 域 两 个 部 分 。 企 
业 的 核心 历史 数据 区 域 主要 包括 主题 域 、 主 题 、 实 体 ， 以 及 实体 与 实体 之 间 的 关系 ， 同 时 为 
了 实现 历史 数据 的 保存 ， 每 个 实体 需要 有 一 个 时 间 戳 。 轻 度 汇 总 数据 区 域 是 根据 决策 分 析 的 
需求 ， 制 定 相 应 的 汇总 委 略 ， 以 满足 用 户 的 需要 。 

11) 数据 集 市 概念 模型 是 根据 业务 需求 建立 起 来 的 ， 它 可 以 包含 两 部 分 内 容 ; 综合 类 的 
分 析 碍 询 和 专业 性 的 分 析 奏 询 。 

12) 数据 集 市 的 主要 工作 有 : 

e 分 析 当 前 的 主题 域 ， 确 定 主题 域 下 面 有 哪些 主题 。 

e 确定 粒度 的 层次 。 

e 确定 事实 表 中 有 哪些 指标 。 

e 确定 事实 表 中 关联 哪些 维度 。 

e 确定 数据 集 市 的 天 系 模式 ， 例 如 是 雪 化 型 模式 还 是 星 型 模式 。 
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8815 Informatica PowerCenter 工 县 简介 


本 章 目 标 

本 章 将 详细 介绍 Informatica PowerCenter 工具 的 使 用 方法 ， 包 括 PowerCenter Designer. 
Repository Manager. Workflow Manager. Workflow Monitor 等 工具 的 菜单 、 组 件 、 工 作 区 及 
其 各 种 功能 的 详细 说 明 。 在 学 习 完 本 章 后， 您 将 了 解 Informatica PowerCenter 各 个 组 件 的 功 
能 、 使 用 方法 等 ， 为 下 一 裔 的 深入 学 习 做 好 充分 的 准备 。 

学 习 本 章 后 ， 您 将 掌握 : 

@ Informatica PowerCenter 的 历史 。 

@ Informatica PowerCenter 的 特点 。 

@ Informatica PowerCenter 的 ee 


€ Informatica PowerCenter 的 工具 介绍 。 
15.1 Informatica PowerCenter 介 绍 
1993 Œ, Informatica 公司 在 美国 加 利 福 尼 亚 州 成 立 ， 一 年 后 在 美国 纳 斯 达 克 成 功 上 市 ， 


2005 年 进入 中 国 ， 开 说 亚洲 最 大 的 营销 市 场 。 截 止 到 2010 年 其 市 值 大 约 为 6.5 亿美 元 ,目前 
AA 1600 ZJE. Informatica 公司 的 总 部 大 楼 如 图 15-1 所 示 。 

















15-1 Informatica 公司 的 总 部 大 楼 (位 于 美国 加 利 福 尼 亚 州 红木 市 ) 
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15.1.1 Informatica 的 特点 


1. 强大 的 多 种 数据 类 型 访问 能 

Informatica PowerCenter 允许 访问 多 种 数据 类 型 ， 包 括 : 

e 结构 化 、 非 结构 化 以 及 半 结 构 化 的 数据 类 型 。 

e 关系 、 大 型 主机 、 文 件 和 其 于 标准 的 数据 。 

e 消息 队列 数据 。 

Informatica PowerCenter 可 以 根据 企业 的 针对 性 需求 ， 对 多 种 数据 类 型 进行 操作 。 访 软件 
可 以 实时 、 批 量 和 通过 变更 数据 捕获 的 方式 来 操作 数据 ， 以 满足 企业 的 业务 需要 。 

2. 企业 级 的 数据 集成 解决 方案 

Informatica PowerCenter 不 仪 能 通过 提供 强大 的 ETL 抽取- 转换 - 涛 载 ) 功能 ， 应 对 部 门 
级 的 数据 仓库 和 数据 集 市 的 各 种 需求 ， 还 能 提供 高 效 鸭 、 高 可 用 性 的 企业 级 数据 集成 解决 方 
案 ， 满 足 企 业 对 安全 、 人 性能、 扩展 性 及 其 他 方面 的 多 种 需求 。 

e 组 件 的 可 重用 性 、 故 障 转 移 、 可 随时 进行 恢复 。 

e 文 持 网 格 计算 。 

e 动态 分 区 功能 。 

@ 基于 元 数据 的 管理 。 

e 开放 的 、 局 扩展 性 的 。 

Informatica 不 只 是 一 个 单一 的 ETL 工具， 目前 它 已 经 发 展 成 为 一 个 面 问 企 业 级 的 、 成 询 
的 数据 集成 方案 供应 商 。 

3. 强大 的 ETL (抽取 -转换 - 北 载 功能 

e 文 持 元 数据 驱动 的 灵活 组 件 染 构 。 

e 文 持 跟 平 台 的 大 数据 量 的 数据 抽取 。 

e 进行 复 琳 的 数据 转换 ， 通 过 对 复 杀 数据 关系 的 深入 判 析 ， 达 到 对 业务 决策 数据 的 精确 

掌握 。 

e RERAN H. 

e 及 时 的 、 可 用 的 、 高 效 的 信息 共享 。 
15.1.2. Informatica 的 优势 


(1) 在 合适 的 时 间 提供 正确 的 信息 

e 实现 统一 、 实 时 的 数据 访问 ， 即 批量 、 接 近 实 时 或 者 实时 的 数据 访问 。 

e 在 整个 企业 内 提供 及 时 可 菲 的 数据 以 满足 分 析 和 运营 要 来。 

e 为 数据 定义 、 数 据 继 承 和 关系 提供 企业 范围 内 的 可 见 性 ， 并 且 拓 局 数据 的 准确 性 和 一 
致 性 ， 以 增强 对 数据 的 信心 。 

e 回答 企业 关于 数据 的 问题 并 随时 为 它 捉 供 毛 需 的 高 质量 数据 ， 以 便 企 业 能 够 更 好 、 更 
友 时 地 作出 决策 。 

(20 满足 企业 级 的 任务 天 键 型 部 普 要 求 

e 消 足 企业 对 安全 性 、 可 扩展 性 和 性 能 的 要 求 ， 并 且 为 企业 的 数据 集成 方案 打下 基础 。 

e 消 足 不 断 增长 的 数据 需求 、 区 省 使 件 成 本 并 降低 与 数据 停 用 期 有 关 的 成 本 和 各 种 风险 。 
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e 借助 PowerCenter 的 ICC 级 安全 功能 来 降低 安全 漏洞 和 隐私 漏洞 的 风险 。 

(3) 提高 路 团队 的 工作 效率 并 加 强 路 职能 协作 

e 有 效 协 调 设计 人 员 ， 让 开发 人 员 和 管理 者 进行 高 效 的 团队 工作 。 

e 可 重用 的 组 件 功 能 。 

e 可 以 轻松 处 理 和 管理 复杂 团队 《其 中 的 成 员 具 有 不 同 的 角色 和 责任 ) 的 BI( 商 业 智 能 ) 
项 目 。 

e 通过 或 励 协 作 、 最 大 程度 地 降低 开发 复杂 性 、 管 理 变更 影响 、 提 高 工作 效率 以 及 缩短 
交付 时 间 的 方式 ， 降 低 IT 项 目 成 本 。 

(4) 成熟 的 市 场 、 丰 富 的 经 验 以 及 众多 的 客户 和 群 

Informatica 公司 在 全 球 拥有 4200 多 位 客户 ， 包 括 : 

e 84 家 “ 财 吝 100 强 ” 公 司 。 

e 道琼斯 中 87% 的 公司 。 

@ 20 个 国家 和 地 区 的 政府 机 构 。 

Informatica 公司 在 各 行业 的 成 绩 : 

e 电信 业 : 全 球 23 家 顶尖 电信 运 宫 丙 中 的 18 家 。 

e 人 金融 服务 : 全球 60 家 顶尖 金融 服务 商 中 的 44 家 。 

e 医疗 保健 : EER 11 家 顶尖 医疗 保健 机 构 中 的 9 家 。 

e 能 源 与 公用 事业 : 全 球 34 家 顶尖 机 构 中 的 25 家 。 

e 你 险 : EEk 22 家 顶尖 保险 公司 中 的 18 家 。 

e 生命 科学 : 全 球 最 大 的 11 家 机 构 。 















































15.2 Informatica PowerCenter 工 具 概 况 


Informatica PowerCenter 工具 由 以 下 部 分 组 成 。 

€ Administration Console (EHHE): 主要 负责 管理 Informatica 服务 、 目 录 、 域 、 市 
Bi. Boe. HRDCUSMBE SET B/S 结构 。 

€ PowerCenter: 用 来 进行 设计 ETL 开发 的 工具 ， 包 括 数 据 产 、 目 标 数据 库 、 英 射 方法 
等 的 定义 及 使 用 。 

@ Repository Manager: 主要 用 来 进行 资源 库 的 管理 、 安 全 性 的 管理 等 。 

€ Workflow Manager: 主要 用 来 进行 工作 流程 的 设计 。 

€ Workflow Monitor: 用 来 监控 、 管 理工 作 流程 及 任务 ， 记 录 会 话 、 工 作 流 程 日 筷 等 信息 。 

















15.3 Informatica Serverss| && 


Informatica PowerCenter 的 服务 引擎 的 局 动 方式 如 下 : 

“开始 ”一 “控制 面板 ”一 “管理 工具 ”一 “服务 ”一 “Informatica PowerCenter 8.1.1”, 
进行 启动 即 可 ， 如 图 15-2 所 示 。 

服务 局 动 之 后 ， 即 可 进行 其 他 客户 端 管理 工具 的 连接 使 用 ， 如 Workflow Manager (CT 
流 管理 器 ) 工具 的 打开 。 
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15-2 Informatica PowerCenter 服务 


15.4 Administration Console 


Informatica PowerCenter Administration Console 是 一 个 对 域 进行 管 理 的 工具 。 通 过 浏览 





可 以 登录 到 该 控制 台 ， 然 后 可 以 针对 日 志 、 资 料 库 备份 、 用 户 账号 安全 权限 以 及 域 对 象 进行 


管理 ， 如 图 15-3 所 示 。 


Informatica PowerCenter ådministration Console — Windows Internet Explorer 


(80) 查看 WW) KERA IAW RAW 














Æ http://localhost:6001/adminconsole/Domains. do Y *t X | Bx 


w d |Æ Informatica PowerCenter Administration Co... | 一 t " B dh T cr AB D- a IRO) ~ 


Administrator Help About Logout 














» 








Informatica PowerCenter Administration Console 


| Domain | Logs Administration Upgrade Manage Account 


* B Details for domain: Informatica Domain ETZTM 
Localhost, NodeO1 (|| Overview Log Management 


2g PowerCenter Integration Service Last updated:5 340 z E 31 03:20:55 2007 
&g PowerCenter 
ON License WWW-CF63B08936C 8356 





| Eg PowerCenter 








Q Q Localhost Node01 


v Uu 


| $$ PowerCenter I... 

















[d &? Internet 





15-3 Informatica PowerCenter Administration Console 
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15.4.1 登录 方式 


首先 介绍 控制 合 服务 的 登录 方式 。 
打开 浏览 器 ， 在 地 址 栏 里 输入 : http://localhost:6001/; 进入 到 如 图 15-4 所 示 的 页 面 中 。 





Informatica PowerCenter Administration Console -— Findows Intern... 加 回国 
THEO dB) SEVO UG) IAM 大助 三 ) 


OG hd e http://localhost:6001/adminconsol: V hea X | 百度 | p|- 
d dir Æ Informatica PowerCenter Admi... ==) t S EJ dah wi sr Am z G] 工具 @) ~ " 


Help About 





























Informatica PowerCenter Administration Console 


Login 





Username: 














Password: 





INFORMATICA™ 


PowerCenter Administration Console 


&? Internet 





15-4 Informatica PowerCenter Administration Console 登录 页 面 


登录 之 后 ， 即 可 进入 到 Informatica PowerCenter Administration Console， 如 图 15-5 所 示 。 
































Informatica PowerCenter Adninistration Console — Windows Internet Explorer 
TFD 编辑 应 ) 查看 人 RERA IAT 帮助 出 ) 
S v Ë| http: //localhost:6001/adminconsole/Domains. do v * (X| | 百度 | p "| 
一 一 - » 
w d Æ Infornatics PowerCenter Administration Co... | | t^c = h M cr Amp z [s IRO) ~ 





Informatica PowerCenter Administration Console 





| Domain | Logs Administration Upgrade Manage Account 


Legend 





* B Details for domain: Informatica Domain 


Overview 








S Localhost nodeO1 
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15-5 Informatica PowerCenter Administration Console 登录 首页 


191 


15.4.2 ”相关 术语 


下 面 介 绍 涉及 的 术语 。 

€ 域 (Domain): 是 节点 (Node) 和 服务 (Service) 集合 在 一 起 的 管理 单元 ， 可 支持 分 
布 式 架构 。 域 (Domain) 包括 服务 (Services). T5434 (Nodes)、 序 列 号 (Licenses), 
文件 夹 (Folders) 和 网 格 (Grids)。 

@ 5; (Nodes: 是 一 个 物理 的 或 者 则 辑 的 单元 ， 可 以 是 一 全 服务器， 也 可 以 是 一 个 虚 
拟 机 。 

e |J; (Services): 在 域 中 的 服务 (Services) 包括 服务 管理 (Service Manager) 和 应 用 
服务 (Application Services). 

e Jr/|*; (Licenses): 主要 描述 了 软件 的 使 用 期 限 。 

e FX (Folders): 用 来 组 织 对 和 象 和 管理 安全 性 操作 。 文 件 夹 可 以 包括 节点 Nodes), 
服务 (Services)、 网 格 CGrids). FZ (Licenses) 和 其 他 文件 夹 (Folders)。 

e 网 格 (Grid): ER EZITA (Sessions) 和 工作 流程 (Workflows). EZAT A 
(Nodes) 上 可 以 运行 集成 服务 CIntegration Service )。 当 在 一 个 网 格 上 运行 工作 流程 或 

会 话 时 ， 进 程 将 在 多 个 节点 之 间 运 行 。 














15.5 PowerCenter Designer 





PowerCenter Designer Cil Eg), N ETL (抽取 -转换 -装载 ) 过 程 提供 源 数 据 的 定义 、 
目标 数据 的 定义 、Mapping 上 映 射 规则 的 定义 功能 ， 帮 助 设 计 人 员 及 开发 人 员 进 行 数据 业务 的 
设计 及 开发 工作 ， 如 图 15-6 所 示 。 





D Intormatica PowerCenter Designer - [topping Designer - Test - (Exa E i alui xil 
39 Eepostory ris yew Took Layout Wersiogng bappings Transformation. Window Heip 28] xli 
BR G| lent Maple] a ma ma ga 100 we GE elamm 图 | yy 
oomoo | 国生 
由 VNDE. a ml = - 
B noue g a e Cop] Ee . 
Taa: 


diodin Dasi ar 






4 | E: 
lappeepwOneneimect] —— 


图 15-6 PowerCenter Designer 界面 
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PowerCenter Designer 工具 可 以 分 为 来 单 、 工 具 栏 、 导 航 、 工 作 区 和 和 输出 窗口 。 
15.5.1 菜单 


1) Repository: 主要 实现 资源 库 的 连接 、 上 断 开 ， 导 入 、 导 出 对 象 ， 打 印 、 保 存 等 功能 ， 
如 图 15-7 所 示 。 
2) Edit: 主要 实现 开发 过 程 中 的 复制 、 粘 贴 、 删 除 、 查 找 、 替 换 等 操作 ， 如 图 15-8 所 示 。 








= Disconnect 
E Add... 


Configure Domains... 


34 Copy Ctrlt+C 


Fage Setup... 


Print Setup... 
Dn! 
Exit y at Select All 


图 15-7 PowerCenter Designer Repository 3 !F. 图 15-8 PowerCenter Designer Edit 5i f. 


3) View: 主要 进行 可 视图 的 切换 ， 例 如 状态 柱 的 显示 和 隐 减 、 全 屏 等 ， 如 图 15-9 所 示 。 

4) Tools: 主要 有 以 下 功能 : ETL 过 程 中 不 同时 期 工作 区 的 切换 ; ee Informatica 
Z« Jm; LH, 比如 Workflow Manager 等 ; 容 户 上 自 定义 视图 设置 ; 用户 目 定义 函数 每 , 如 图 15-10 
所 示 。 








ource Analyzer 
arget Designer 


I3 Lon: 1 


ransformation Deweloper 


applet Designer 


Mapping Designer 


ee iiis —ÀX 


m Status Bar Repository Manager 
F l Ies 
Havi gator BACH 
: Workflow Manager 
= Untput 
m UU Workflow Monitor 
Debugger k 
Dueries... 
Üüptions... 
[-] Workbook E Customize... 
CT Properties.. ContentMaster Studio 
图 15-9 PowerCenter Designer View 5i Hi 图 15-10 PowerCenter Designer Tools 菜单 


5) Layout: 主要 进行 放大 、 缩 小 ， 排 列 等 布局 的 设置 ， 如 岁 15-11 所 示 。 
6) Versioning: 是 版 本 控制 菜单 ， 主 要 实现 检 入 、 检 出 ， 版 本 对 比 等 功能 ， 如 图 15-12 
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ZR o 


此 


图 15-11 PowerCenter Designer Layout 荣 单 


Iconize 
Restore 

Zoom Center 
Zoom Point 
Zoom Rectangle 
Zoom Hormal 
scale To Fit 


Zoom Percent 


Árrange.. 
Arrange All 
Arrange All Iconic 


Copy Columns 


Link Columns 


Áutolink... 


^ Autolink by Hame 
^ Autolink by Pozition 





图 15-12 PowerCenter Designer Versioning 5 f. 


ik: 以 下 末 单 不 会 同时 显示 ， 分 别 对 应 ETL 过 程 的 不 同时 期 。 

1) Sources: 用 于 导入 源 数 据 ， 比 如 关系 型 数据 库 、 文 件 类 型 、XML、SAP、WSDL 等 
类 型 数据 ， 如 图 15-13 所 示 。 

2) Targets: 用 于 导入 目标 数据 (可 以 从 关系 型 数据 库 、 文 件 、 XML、SAP、Tibco、WSDL 








等 类 型 数据 导入 )， 创 建 、 编 辑 维度 ， 创 建 、 编 辑 立方 体 等 ， 如 图 15-14 所 示 。 


E Import from Database... 
cR Import from File... 
Import from Cobol File.. 


Import 4ML Definition... 


Profiling 


Import From SAP... 


SAP Functions... 


Import From PeopleSoft ... 


Import from Siebel ... 


| Rej Import from WSDL (Consumer)... 
Import from WSDL (Provider) ... 
Import from PowsrExchange... 


Import from Salesforce. com... 


图 15-13 PowerCenter Designer Sources 5 ^F. 
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Import From SAP BW... 
Import TIBCD... 

fti Import from WEDL Consumer)... 
Import fram WSDL (Prowider] ... 
Import from PowerExchangs... 


Import from Salesforce. com... 


-1 
iS Compare... 


tÉ Create/Edit Dimension... 
m Create Lube... 

m Edit Cube... 

E Close Cube 


图 15-14 PowerCenter Designer Targets 5i FF. 





3) Transformation: 主要 实现 导入 存储 过 程 、 创 建 转换 定义 等 功能 ， 如 图 15-15 所 示 。 
4) Mapplets: 主要 实现 可 和 曹 用 组 件 操 作 功 能 ， 例 如 创建 、 编 辑 、 删 除 、 验 证 、 依 赖 、 比 
较 等 操作 ， 如 图 15-16 所 示 。 








Create... 


Import Stored Frocedure... 


Import External Procedures... 


Create... 


El 
i Compare... 


— Compare... 
Frofiling k 
Create Mapplet for Siebel Calculated Fields... 


图 15-15 PowerCenter Designer Transformation 3£!& K] 15-16 PowerCenter Designer Mapplets 35 


5) Mappings: 是 映射 规则 的 定义 、 编 辑 、 删 除 、 验 证 等 操作 菜单 ， 如 图 15-17 所 示 。 
6) Window: 主要 实现 新 建 窗 口 ， 级 联 层 登 等 窗口 切换 显示 功能 ， 如 网 15-18 所 示 。 





m Create... 
Copy Ás... 

| Edit... 
Close 
Delete 

/ Validate 


Ix F 


Dependencies... 
Propagate Attributes... 
2 Expand/UnExpand... 


KT. 
"n Compare... 


i=" Parameters and Variables... 


Metadata Extensions... 


Hew Window 
a] Target Load Flan... 


Stored Procedures Flan... Cascade 

Generate SAP REC/BAPI Mapping... Tile 

Generate BCI Mapping... Arrange Icons 
Generate and Install SAF R/3 Code... E Mew Sb 
Cleaning ABAF Frogram Information... 

Import from Data Federation Server... l Start Page 


2 Mapping Designer - Fire - [PowerCenter] 


Debugger k Windows... 


Wizards k 


图 15-17 PowerCenter Designer Mappings 2f. 图 15-18 PowerCenter Designer Window 5E 5. 








7) Help: 主要 实现 显示 Informatica 的 文档 、 版 本 信息 等 功能 ， 如 图 15-19 所 示 。 





Contents 
Tip of the Day 
Start Page 


About Informatica Designer... 


图 15-19 PowerCenter Designer Help 5i FF. 
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1552 工具 栏 


HX PowerCenter Designer 工具 栏 的 介绍 见 表 15-1. 


ETETEI 


X 15-1 


Repository Manager 


PowerCenter Designer 


WorkFlow Manager 


WorkFlow Monitor 


Update Strategy Transformation 





Expression Transformation 


Filter Transformation 


Aggregator Transformation 


Lookup Transformation 


UR 


Sequence Generator Transformation 


Stored Procedure Transformation 


External Procedure Transformation 


Custom Transformation 


Joiner Transformation 


Normalizer Transformation 


Rank Transformation 


Mapplet Input 


Mapplet Output 


Router Transformation 


Sorter Transformation 


Transaction Control Transformation 


Source Qualifier Transformation 


XML Source Qualifier Transformation 


Application 
Transformation 


Source 


Qualifier 


PowerCenter Designer 工具 栏 


fh — X 

打开 Repository Manager 工具 操作 ， 如 当前 工具 用 户 已 登录 ， 则 以 
当前 用 户 登 录 

如 当前 工具 不 是 PowerCenter Designer， 则 将 其 打开 。 葫 当前 工具 
用 户 已 登录 ， 则 以 当前 用 户 登 录 
打开 WorkFlow Manager， 如 当前 工具 用 户 已 登录 ， 则 以 当前 用 户 
录 
打开 WorkFlow Monitor， 如 当前 工具 用 户 已 登录 ， 则 以 当前 用 户 
录 
更 新 策略 转换 组 件 (Update Strategy Transformation )， 主 要 实现 插 
A Onsert), 53 (Update), HIER (Delete) MJEH (Reject) 等 更 
狐 策 上 略 

用 表达 式 方式 来 实现 源 数 据 的 转换 业务 ,主要 功能 为 基于 单行 记录 
的 表达 式 计算 

主要 实现 条 件 的 过 小 功能 

实现 源 数 据 在 转换 为 结果 过 程 中 的 聚合 功能 ， 比 如 汇总 、 平均 值 等 

主要 功能 为 查找 相关 的 值 ， 然 后 传递 给 其 他 的 对 和 象 

当 目 标 表 中 有 自动 增值 键 时 , 使 用 该 组 件 在 插入 目标 表 数 据 时 会 自 
动 对 key 增加 ， 即 产生 一 组 唯一 的 序列 号 值 

导入 存储 过 程 











UR 





























调用 一 个 或 多 个 外 部 定义 的 过 程 


该 组 件 主要 操作 外 部 建立 的 过 程 





类 似 于 数据 库 脚 本 语言 SQL 语句 中 的 join on 关键 子 
主要 功能 为 对 源 数 据 进 行 格式 化 ， 例 如 将 一 行 数据 分 多 行 显示 


主要 输出 位 于 最 底层 或 最 顶层 的 多 个 数据 的 集合 , 起 到 排序 记录 
的 作用 


传输 数据 到 可 重用 组 件 中 

从 可 重用 组 件 传输 数据 到 映射 

主要 功能 为 按照 条 件 分 组 来 过 小 数据 

基于 键 字 段 进行 顺序 或 倒序 的 排序 操作 

主要 进行 控制 事务 的 一 系列 操作 ， 例 如 提交 、 回 滚 
功能 为 从 源 表 中 查询 出 所 有 的 数据 

该 组 件 定 义 了 在 一 个 会 话 期 间 读 取 的 数据 元 素 























当 运 行 一 个 工作 流 时 ， 该 组 件 展示 抽取 的 行 集 


FE! HTTP Transformation 


LS Web Services Consumer Transformation 


wwe Java Transformation 


K: :| XML Parser Transformation 


B XML Generator Transformation 


ch Unstructured Data Transformation 





Jh — 0X 
该 组 件 可 以 确定 Integration Service 如 何 从 MQSeries 消息 队列 源 
数据 中 读 取 数据 
该 组 件 可 以 确定 Integration Service 如 何 读 取 TIBCO 源 数 据 





该 组 件 处 理 从 SAP 系统 接收 来 的 IDoc 数据 


该 组 件 只 能 为 特定 的 IDoc 类 型 解释 数据 。 在 单个 映 冉 中 ,可 能 包 
括 多 个 该 组 件 来 展示 多 种 IDoc 类 型 


该 组 件 从 映射 和 分 段 数据 的 上 洲 组 件 中 接收 数据 


该 组 件 用 于 开发 类 似 于 邮件 系统 的 案例 ， 比 如 邮件 已 经 发 出 但 是 
收 件 人 的 地 址 已 经 更 新 的 情况 

该 组 件 允 许 连 接 到 一 个 HTTP 的 服务 器 并 使 用 它 的 服务 和 应 用 。 
当 使 用 该 组 件 允许 一 个 会 话 时 ，Integration Service 连接 到 HTTP 服 
务 并 发 出 一 个 请 求 ， 具 体操 作 是 获取 数据 还 是 更 新 数据 ， 取 决 于 在 
该 组 件 的 配置 中 选择 了 Read Data on the HTTP Server 还 是 Update 
Data on the HITP Server 

该 组 件 提供 了 创建 Web Services 客户 端的 3 种 方式 : 从 远程 的 基 
于 URL 的 WSDL 文件 导入 、 从 本 地 的 WSDL 文件 导入 以 及 从 远程 
的 基于 UDDI 目录 的 WSDL 文件 导入 

该 组 件 处 理 外 部 的 SQL 脚本 或 者 SQL 查询 。 有 两 种 模式 脚本 
模式 CScript Mode) 和 查询 模式 (Query Mode) 

进行 从 多 数据 源 中 合并 数据 到 目标 数据 的 操作 , 类 似 于 SQL 语言 
中 的 Union all 关键 字 

与 Java 程序 开发 语言 的 功能 定义 提供 了 一 个 简单 的 本 地 接口 。 
使 用 该 组 件 ， 可 以 在 不 具备 Java 开发 语言 的 知识 或 者 没有 额外 的 
Java 开发 环境 的 情况 下 ， 实 现 一 个 简单 的 、 适 度 复 杂 的 Java 程序 
转换 功能 

一 个 简单 的 XML 源 数据 抽取 功能 。 该 组 件 允 许 从 消息 系统 〈 例 
如 TIBCO 或 者 MQ Series) 和 其 他 数据 源 ( 例 如 文件 或 者 数据 库 ) 
中 抽取 XML 数据 ， 并 逐 行 读 入 ， 进 行 剖 析 、 传 递 数 据 。 例 如 ， 可 以 
从 TIBCO 源 数 据 中 抽取 XML 数据 ， 然 后 传递 给 关系 型 目标 数据 

该 组 件 的 功能 与 XML 齐 析 器 转换 组 件 〈XML Parser Transfor- 
mation) 相反 。 例 如 ， 可 以 从 关系 型 目标 数据 中 抽取 XML 数据 并 传 
递 给 目标 数据 

该 组 件 允 许 从 非 结 构 化 源 数据 中 抽取 数据 并 进行 转换 。 例 如 ， 可 
以 使 用 该 组 件 从 Microsoft Word. Microsoft Excel. Microsoft 
PowerPoint, Adobe PDF 等 , 以 及 特殊 的 工业 标准 的 格式 (如 ACORD、 
FIXML 等 ) 抽取 数据 

















PowerCenter Designer 的 组 件 (Transformation) 是 Informatica 的 重要 组 成 部 分 ， 所 有 的 数 
据 抽 取 操 作 痢 是 由 以 上 组 件 构成 的 ， 读 者 需要 熟练 掌握 。 











15.5.3 ”导航 





PowerCenter Designer 导航 如 图 15-20 所 示 。 


每 个 目录 都 由 以 下 几 部 分 组 成 。 
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Repository Navigator 一 X 





= Repositories 


E T" z Example 
: E - Test 
3 — fat Business Components 
日 - [7 Sources 
: E - " ”ord 
: m vV BONUS 
Yi» COUNTRY 
: me "iS DEPT 
! mM vD EMP 


Lew E SALGRADE 


3 benc [E cubes 
| € [2 Dimensions 
— [E Transformations 
: fat Mapplets 
E I [El Mappings 
> "»33 Examplel 


图 15-20 PowerCenter Designer 导航 


Business Components OZH). 
Sources 〈 源 数据 )。 

Targets〈 目 标 数据 )。 

Cubes CZJ). 

Dimensions (JZ). 
Transformations 〈 转 换 组 件 )。 
Mapplets 〈 可 重用 组 件 )。 
Mappings CHE TX. 


155.4 工作 区 


PowerCenter Designer 工作 区 如 图 15-21 所 示 。 

工作 区 分 以 下 5 个 设计 窗口 。 

€ Source Analyzer: 进行 源 数据 的 设计 、 显 示 等 操作 。 

Targets Designer: 进行 目标 数据 的 设计 、 显 示 等 操作 。 

Transformation Designer: 进行 组 件 的 设计 操作 。 

Mapplets Designer: 进行 可 重用 组 件 的 设计 操作 。 

Mapping Designer: 映射 规则 的 处 理 ， 源 数据 到 目标 数据 的 转换 过 程 中 的 规则 定义 。 
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GM 
— 1CUER anmberfzl 


E COUNIEY [ürac le] m= 


EED  mmerips 
EE date OoOO oo 
EFC varchar? | 
EID omber 00 


FIHI varcharz 





图 15-21 PowerCenter Designer 工作 区 


15.5.5 ”输出 窗口 


PowerCenter Designer 输出 窗口 如 图 15-22 所 示 。 





[Output Window 


...data flow validation completed with no errors. 
Parsing mapping Examplel... 
...parsing completed with no errors. 


Hk Mapping Examplel is VALID sxkekkekek 
mapping Examplel inserted. 


[Dr Dih sse 








图 15-22 PowerCenter Designer 输出 窗口 


输出 窗口 包括 以 下 7 个 选项 卡 。 

@ Save: 当 进 行 保 存 操作 时 ， 访 输出 将 显示 已 保存 的 其 体操 作 信 息 。 
€ Fetch Log: 获取 日 志 输 出 信息 。 

€ Generate: 输出 创建 对 象 的 日 志 信 息 。 
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e Validate: 验证 信息 的 输出 。 如 果 在 验证 过 程 中 出 错 ， 请 仔细 但 看 该 错误 输出 信息 ， 便 
于 快速 地 得 找 出 问题 的 根源 所 在 。 

@ Debugger: 调试 信息 的 输出 。 

€ Session Log: Session 日 志 的 输出 显示 。 

€ Notifications: 该 输出 将 显示 连接 资源 库 的 相关 信息 ， 比 如 成 功 、 失 败 等 。 











15.6 Repository Manager 


Repository Manager CAJ E HEZ) 主要 对 Repository 库 进 行 管理 ， 包 括 安全 性 管理 。 例 
如 ， 文 件 夹 的 创建 、 用 户 访 问 权 限 、 安 全 以 及 密码 的 管理 等 内 容 ， 如 图 15-23 Br. 



































f Informatica PowerCenter Repository Manager - [Example] - [=] x| 
Repository Edit view Folder "versioning Security Analyze Tools Windows Help 
[ajo o o 
Repository Navigator ~x] z 
= eom COUNTRY E 
日 & Example [ESSEN | Nt 
(2 Deployment Groups D EXE ID - 1 number(... 38 0 NOT A KEY nc 
B € Test D EXE DATE - 2 - date 19 0 NOT AKEY nc 
B e Sources D EXE. CO... 3 varchar2 50 D NOT å KEY nc 
: "v BONUS D KILLED 4 number 15 0 NOT A KEY ye 
NA D EXE ME... 3 varchar2 50 ü NOT A KEY ye 
Vi DEPT 
[i EMP 
"i  SALGRADE 
由 … (B Targets 
H- ff Mappings 
由 … P Sessions 
H- £ workflows 
(2 Configurations 
& Rep 
B wf 
加 
RM S 





图 15-23 PowerCenter Repository Manager 界面 


15.6.1 菜单 


1) Repository: 主要 实现 资源 库 的 连接 、 断 开 ， 添 加 知识 库 、 配 置 域 ， 寻 入 、 导 出 对 象 ， 
导入 、 导 出 元 数据 等 功能 ， 如 图 15-24 所 示 。 

2) Edit: 主要 完成 开发 过 程 中 的 复制 、 粘 贴 、 删 除 ， 显 示 锁 、 用 户 连 接 信息 ， 元 数据 信 
恩 日 志 等 操作 ， 如 图 15-25 所 示 。 

3) View: 主要 进行 视图 的 显示 , 例如 状态 栏 、 叶 般 条 、 输 出 的 显示 或 隐藏 等 ,如 图 15-26 
所 示 。 

4) Security: 主要 进行 资源 库 的 安全 管理 ， 比 如 修改 当前 密码 、 管 理 用 户 和 授权 等 ， 如 
15-27 所 示 。 
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=A Iizconnect 


chow Locks... 


chow User Connections... 


Metadata Extensions... 


Exit 
图 15-24 PowerCenter Repository 图 15-25 PowerCenter Repository 
Manager Repository 菜单 Manager Edit i£ f. 
Toolbar... 


Status Bar 
Havi gator 


IL) Üutput 
=j Change Current Password... 


Manage Users and Frivilezes... 


图 15-26 PowerCenter Repository 图 15-27 PowerCenter Repository 

Manager View i£ FF. Manager Security 5i FF. 
5) Analyze: 主要 实现 源 、 目 标 数据 以 及 映射 等 的 依赖 关系 得 询 功能 ， 如 网 15-28 所 示 。 
6) Tools: 主要 完成 工具 的 切换 、 导 入 、 导 出 知识 库 等 操作 ， 如 图 15-29 所 示 。 


Repozitory Manager 


| Source/Target Dependencies (9 Designer 
| 此 加 Mapping Dependencies W) Workflow Manager 
M) Workflow Monitor 





i T Shortcut Dependencies 
Export Registry... 
l Import Registry... 


| Ej Search by Target Keyword... Remove Repository... 


Search All... Queries... 
Eroperties... Dptions... 
Customize... 
图 15-28 PowerCenter Repository 图 15-29 PowerCenter Repository 
Manager Analyze 5i f. Manager Tools 3i f 


15.6.0 ”工具 栏 


HX PowerCenter Repository Manager 工具 栏 的 介绍 见 表 15-2. 


X 15-2 PowerCenter Repository Manager T Rf 


Eo 描述 
B 连接 资源 库 服务 器 
a 断 开 资 源 库 服务 器 
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Ho og] mo x 
但 看 依赖 
TUE UR A ZR 
- 但 看 快捷 依赖 关系 
= 以 关键 子 但 询 
属性 


底 端 依赖 视 网 最 小 化 


15.6.3 ”导航 


PowerCenter Repository Manager 导航 如 图 15-30 所 示 。 





Repository MNavizator T X 
B Repositories 
E. B Example 
: | bins [2 Deployment Groups 
E 多 Test 
E f Sources 
| -- VB BONUS 
LM [COUNTRY 
d "5 DEPT 
— vE EMP 


T (2 Targets 

- [2 Mappings 

- [2 Sessions 

ks [3 workflows 
— [El Configurations 


图 15-30 PowerCenter Repository Manager 导航 


15.6.4 工作 区 


PowerCenter Repository Manager 工作 区 如 图 15-31 所 示 。 





E 
Business Name | Data Type | Precis... | Scale |Key Type |Nullable — |Referenc... | Reference 
9$ EMPNO  - 1 - number(... 4 0 PRIMAR... no 
D ENAME - 2 x varchar2 10 ü NOT A KEY yes 
D JOB - 3 - varchar2 9 ü NOT å KEY yes 
Di MGR - 4 - number(... 4 0 NOT A KEY yes 
D HIREDATE - 3 z date 19 0 NOT A KEY yes 
D SAL B 6 x number(.. 了 2 NOT A KEY yes 
D COMM - 7 E number(... 了 2 NOT A KEY yes 
$ DEPTNO - 8 = number(... 2 0 FOREIGN... ves DEPTNO DEPT 





图 15-31 PowerCenter Repository Manager 工作 区 
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15.7 Workflow Manager 


Workflow Manager (Tm EHE 工具 主要 完成 任务 、 流 程 的 设计 管理 ， 基 于 时 间 、 
事件 的 合理 调 肛 等 内 容 ， 如 图 15-32 PR. 

















W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example]] - [B] x| 
¿ Repository Edit View Tools Layout wersioning Workflows Tasks Service Connections Window Help - [8| x| 
: v3 A a W Test - [Example] m 100% . (3i t v P o ÁIo o 4 
&o2S3Gerx*s:oolmcJo ame[sagostssluei 
(Repository Navigator - x| l T 
E. Task Worklet | Sa Workflow 
&3 Repositories | f Developer i Ê Designer e vf testi X 


G- B Example 
E PowerCenter Integration Service 


De 六 Test 
(D Tasks 
E 0 Sessions 
B 
(D  worklets 
6 workflows 
& Rep 
& wf 





i nil a 
A b A 了 5 


s Testi 












Starting wf testl 
*H(PowerCenter Integration Service) Start workflow: Request acknowledged 
(PowerCenter Integration Service) Start workflow: INFO: Starting execution of workflow [wf testi] in folder [Test] last saved by user [Administrator]. 





tput Window 


esI Dr [>f Save A Fetch Log À Validate À Copy } Integration Service (Notifications / 四 g 
Ready | C Nnm] ] % 


图 15-32 PowerCenter Workflow Manager 界面 














Workflow Manager L H.-E3Xépgiser. TL EAE. WS. TEKME fi D1 2B EV. 


15.7.4 菜单 

1) Workflows: 主要 完成 工作 流 相 关 的 配置 功能 ， 比 如 创建 、 编 辑 、 删 除 、 局 动 等 ， 如 
15-33 所 示 。 

2) Tasks: 主要 完成 任务 的 创建 、 编 辑 、 打 开 、 连 接 、 局 动 、Session 设置 等 功能 ， 如 
15-34 所 示 。 

3) Service: 用 于 选择 在 Integration Service 上 运行 的 工作 流 ， 如 图 15-35 所 示 。 

注意 : 该 菜单 需要 将 所 有 的 文件 夹 目 录 (Folders) 关闭 才能 执行 。 若 要 关闭 某 个 文件 夹 
目录 ( Folder )， 用 和 鼠标 右键 单 击 该 Folder， 在 弹出 的 快捷 菜单 中 选择 Disconnect 命令 即 可 ， 
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如 图 15-36 所 示 。 





”ra 


Edit 
Clase 
Delete 


fi Tis, 


|, Link Task 


start Workflow 


Recover Workflow 
Uo Validate 
2| ochedulers... 


&á Compare... 


Dependenciesz... 


r Wizard mra Sesslon Lonfiguration... 


图 15-33 PowerCenter Workflow 图 15-34 PowerCenter Workflow 
Manager Workflows zie f. Manager Tasks zi f. 





[^ Assign Integration Service... 





图 15-35 PowerCenter Workflow Manager Service 3i FF. 


4) Connections: 进行 天 系 型 数据 库 、 队 列 、FTP、 应 用 程序 等 的 连接 操作 ， 如 图 15-37 
所 示 。 


&3 Repositories 
H- & Example 
日 PowerCenter Integration Service 

























日 Tes — — 
区 区 v Allow Docking - 
Hide W Relational... 
加 | 
= E Queue... 
ES 区 Disconnect 全 t 
由 … € G Application... 
= Rep open E Loader 
& wf Find Checkouts... EN 一 in 
Properties JE Replace... 


[lk 15-37 PowerCenter Workflow 


15-36 ”选择 Disconnect 命令 "un 
Hi EE Lu Manager Connections 菜单 


1572 工具 栏 


有 关 PowerCenter Workflow Manager 工具 栏 的 介绍 见 表 15-3. 


表 15-3 PowerCenter Workflow Manager 工具 栏 


按 钮 jü 述 





编辑 工作 尝 或 可 重用 组 件 


编辑 调度 


To 
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15.7.3 


导航 


验证 完整 性 

调度 工作 流 

启动 Integration Service 
创建 、 编 辑 关 系 型 数据 库 连接 
创建 、 编 辑 关 系 队列 连接 
创建 、 编 辑 FTP 连接 
创建 、 编 辑 应 用 连接 
创建 、 编 辑 装 载 器 连接 
替换 连接 

选择 在 Integration Service 上 运行 的 工作 流 
创建 一 个 会 话 
创建 一 个 命令 
创建 一 个 邮件 
创建 一 个 决议 
创建 一 个 任务 
创建 一 个 计时 器 
创建 一 个 控制 器 
创建 一 个 事件 等 待 
创建 一 个 事件 挂 起 
创建 一 个 可 重用 组 件 
建立 连接 线 

会 话 控制 操作 


创建 一 个 调度 


PowerCenter Workflow Manager 导航 如 图 15-38 所 示 。 
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Repository Navigator "X 
B Repositories 

日 © Example 

: | zl PowerCenter Integration: Service 


[2 Tasks 
Sessions 
LYE s Testl 
worklets 
workflows 





图 15-38 PowerCenter Workflow Manager 导航 


15.7.4 工作 区 


PowerCenter Workflow Manager 工作 区 如 图 15-39 所 示 。 







| 与 


:| Developer jJ 





s Testl 


图 15-39 PowerCenter Workflow Manager 工作 区 


€ Task Developer: 任务 开发 设计 窗口 。 
€ Worklet Designer: Worklet 开发 设计 窗口 。 
€ Workflow Designer: 工作 流 编 辑 器 。 
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15.7.5 ”输出 窗口 


PowerCenter Workflow Manager 输出 窗口 如 图 15-40 所 示 。 







Output Window 


SLL Lr Lo Save A Feteh Log À Validate À Copy À Integration Service 


Starting wf testl 
M (PowerCenter Integration Service) Start workflow: Request acknowledged 
(PowerCenter Integration Service) Start workflow: INFO: Starting execution of workflow [wf testi] in folder [Test] last saved by user [Administrator]. 


区 
回国 


Ready o S dE jy 


15-40 PowerCenter Workflow Manager 输出 窗口 


15.8 Workflow Monitor 





Workflow Monitor (工作 流 监 控 器 ) 是 针对 任务 、 工 作 流 程 运行 时 的 一 个 全 方位 监控 和 中 
蹊 的 管理 机 制 ， 如 图 15-41 所 示 。Workflow Monitor 用 于 记录 服务 运行 中 的 日 志 信 息 ， 包 括 
会 话 (Session) 日 志和 工作 流程 (Workflow) 日 志 ， 通 过 记录 、 收 集 、 分 析 这 些 日 志 信息 ， 


可 以 对 整 





ZA ETL 过 程 进行 全 面 的 掌控 。 


M Informatica PowerCenter Workflow Monitor - [B| x| 
Repository Edit View Tools Task Filters Help 





90 32185 -|m[liso|v»- ix [3*5 


8 Durati Stat 
E Serm. ENT i 


Repositories 

SE B Example 
i B &j PowerCenter Integration Service Disconnected 
B 的 Test 
Ee wf testl : 00: Succeeded 


Succeeded 








Properties 


s_Testl [2007-5-27 16:52:58] 
AA Task Details 


Attribute Name Attribute Value ^ 


Instance Hame s Testi 

Task Type Session 

Integration Service Hame PowerCenter Integration Service 
Node (s) node01 20100T29-1030 

Start Time 2007-5-27 18:52:58 

End Time 200T-5-2T 18:53:16 


Recovery Time(s) 
Status Succeeded 


Source/Target $ Statistics 
> 
e 





L.]NM| lz 


15-41 PowerCenter Workflow Monitor 界面 
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15.8.4 工具 栏 





5: ERTI. Hh 15-42 所 示 的 对 话 框 。 


Filter Tasks E3 


Shaw Ehe following Easks: 





Contral 


L] Email cancel | 
Event Wait Help | 
Session 

Ll Start 

Timer 





|^ 
hal 
Ir 
(m 
ir 
E 


图 15-42 PowerCenter Workflow Monitor Filter Tasks 对 话 框 





?; Integration Services 过 滤器 设置 。 单 击 该 按钮 会 弹出 如 图 15-43 所 示 的 对 话 框 
^: 在 Task View 视图 下 ， 增 加 显示 列 的 过 滤 条 件 。 
^': Æ Task View 视图 下 ， 显 示 最 近 运 行 的 任务 。 





Filter Integration Services E 


Shaw Ehe Following 





Paowercenker Integrakion Service 


[^ 
bod 
Ici 
Im 
br 
E 





图 15-43 PowerCenter Workflow Monitor Integration Services 对 话 框 


T, 显示 属性 。 
2: ERTA HE. 


: 显示 Session Hii. 


15.8.2 监控 区 








监控 区 分 为 甘 特 图 (Gantt Chart) 和 任务 视图 CTask View) 两 种 显示 方式 。 
CD HER 








甘 特 图 直观 地 显示 了 各 个 工作 流 的 运行 情况 ， 便 于 用 户 通 过 有 效 的 调度 避 开 系统 运 


—. 


瓶颈 ， 为 系统 调 优 据 供 了 依据 ， 如 网 15-44 所 示 。 
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o 


— 


行 的 


DIXI RN 
4:00pm 5:00pm |B:00pm |T:OO0pm [8:00pm |9 


日 -图 Example 
El g PowerCenter Integration Service Disconnected 

a- Test 

日 -入 wf_testl 00:00:18 | Succeeded 

c = Testi] 00:00:18 | Succeeded 

















15-44 PowerCenter Workflow Monitor Gantt Chart 监控 区 
(2) 任务 视图 
任务 视图 显示 了 工作 流 运 行 的 开始 时 间 、 结 束 时 间 及 运行 状态 等 信息 ， 如 图 15-45 所 示 。 


ro 





















g 图 Repositories 
z cg- E- Ej PowerCenter Integratio... 
3X |. &-B Powercenter In| 日 -六 Test 
sA -P Test 日 -6 入 w£ testl 
= i : 4f wf testi 日 €" wf testi 2007-5-27 15:52:58 2007-5-27 15:53:18 Succeeded 
3 ; 8 Rep 7 PO ie s Testi 2007-5-27 16:52:58 2007-5-27 18:53:18 Succeeded 
i E "€ wf testl 2007-5-27 15:28:24 2007-5-27 15:28:48 Succeeded 
2 -B wf -8 s_Testl 2007-5-27 16:28:25 2007-5-27 16:28:49 Succeeded 


4 


[ Gantt chart | Chart | Task view | 


15-45 PowerCenter Workflow Monitor Task View 监控 区 


15.8.3 属性 


PowerCenter Workflow Monitor 属性 如 图 15-46 所 示 。 





Properties X| 
s_Testl [2007-5-27 16:52:58] Lot 
bA Task Details 
Attribute Name Attribute Value ^ 
Instance Hame s Testl 
Task Type Session 
Integration Service Hame PowerCenter Integration Service 
Node (x) nodeü1 20100729-1030 
Start Time 2007-5-27 15:52:58 
End Time 200T-5-21T 16:53:16 
Recovery Time(s) 
Status Succeeded 


z| 


b Source/Target Statistics 
- 
- 







15-46 PowerCenter Workflow Monitor 属性 


€ Workflow Details: 显示 工作 流 的 详细 信息 ， 包 括 开 始 时 间 、 结 束 时 间 、 运 行 状 态 、 对 
结果 数据 的 影响 等 信息 。 

€ Task Progress Details: 显示 任务 进程 的 详细 信息 。 

€ Session Statistics: 显示 会 话 的 统计 信息 ， 包 括 源 数据 、 目 标 数 据 所 涉及 的 成 功 和 失败 
的 行 数 等 信息 。 
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15.9 本 章 小 结 


1) Informatica 的 特点 : 强大 的 多 种 数据 类 型 访问 能 力 、 企 业 级 的 数据 集成 解决 方案 、 强 
大 的 ETL 抽取 -转换 - 北 载 ) 功能 。 

2) Informatica 的 优势 : 在 合适 的 时 间 提 供 正 确 的 信息 ， 满 足 企 业 级 的 任务 关键 型 部 署 要 
求 ， 提 高 路 团队 的 工作 效率 并 加 强 路 职能 协作 ， 成 熟 的 市 场 、 丰 军 的 经 验 以 及 众多 的 客户 群 。 

3) PowerCenter Designer Ci EIE. W ETL《〈 抽 取 - 转 换 - 攻 载 ) 过 程 提供 源 数 据 的 
定义 、 目 标 数据 的 定义 、Mapping 上 映 射 规则 的 定义 功能 ， 帮 助 设计 人 员 及 开 上 有 友人 员 进 行 数 据 
业务 的 设计 及 开发 工作 。 

4) Workflow Monitor 是 针对 任务 、 工 作 诉 程 运行 时 的 一 个 全 方位 监控 和 跟 踩 的 管理 机 
制 。Workflow Monitor 用 于 记录 服务 运行 中 的 日 忘 信息 ， 包 括 会 话 〈Session) 日 志和 工作 尝 
fE (Workflow) 日 志 ， 通 过 记录 、 收 集 、 分 析 这 些 日 志 人 信息， 可 以 对 整个 ETL 过 程 进行 全 面 
DESAT 

5) 通过 本 章 学 习 , 斌 者 了 解 了 Informatica PowerCenter 体系 4 大 工具 的 基本 使 用 与 作用 。 

€ PowerCenter Designer: ETL ibas. HEIT ETL 的 开发 和 设计 工作 。 

€ Repository Manager: 资源 库 的 管理 工具 。 

€ Workflow Manager: 工作 流 管 理 需 ， 包 括 创 建 、 运 行 等 。 

€ Workflow Monitor: 工作 流 监 控 器 ， 进 行 流程 的 监控 、 日 六 的 记录 等 。 
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第 16 & | Cognos I. R (8T 


本 章 目标 

Cognos 能 帮助 客户 提取 公司 的 业务 数据 ， 然 后 通过 后 从 计算 分 析 ， 制 作出 可 以 为 公司 的 
管理 层 提供 决策 的 分 析 报 表 。 

Cognos 通过 报表 展示 的 数据 ， 是 基于 统一 的 元 数据 模型 。Cognos 强大 的 报表 制作 功能 6 
以 制作 出 满足 任何 需求 的 报表 ， 其 基于 B/S 的 使 用 方式 在 提供 方便 的 同时 ， 还 将 部 团 成 本 和 
管理 成 本 降 到 最 低 。Cognos 还 可 以 同 数据 挖掘 工具 及 统计 分 析 工 具 搭 配 使 用 ， 以 增强 决策 分 
析 的 功能 。 

学 习 本 半 后 ， 您 将 掌握 : 
Cognos 的 历史 。 
Cognos 的 特点 。 
Cognos 的 安装 。 
Cognos 工具 概览 。 
Cognos 架构 简介。 


Cogno 快速 入 门 。 























16.1 Cognos 介 绍 


16.1.1 Cognos 的 历史 


1969 ^E, Cognos 公司 在 加 拿 大 站 都 涯 太 华 正式 成 并 。 

ROLLY], Cognos 公司 的 主要 业务 并 非 是 商业 智能 ， 而 是 像 大 多 数 科技 公司 一 样 ， 将 公 
司 业 务 定义 为 信息 咨询 与 管理 方向 。 儿 年 后 ，Cognos 公司 的 高 层 人 员 ， 才 将 公司 业务 定义 为 
商业 智能 方向 ， 这 也 为 它 最 终 成 为 商业 智能 巨头 指明 了 正确 的 方 回 。 

2008 年 ， 国际 丙 业 机 器 公司 IBM 以 50 亿美 元 的 高 价 将 Cognos 购 入 旗下 。 从 此 ，Cognos 
Efa IBM 的 全 球 影 响 力 ， 加 速 了 其 国际 化 市 场 的 发 展 。 


16.1.2. ”Cognos 的 特点 


(D 方便 的 基于 B/S 架构 的 报表 开发 工具 

Cognos Connection 是 基于 B/S 架构 的 Cognos 门户 ， 一 切 操 作 都 可 以 在 浏览 器 里 进行 ， 
极 大 地 方便 了 设计 及 开发 人 员 。 

(2) 强大 的 报表 制作 、 部 署 、 发 布 、 管 理 功能 

报表 的 制作 、 部 普 、 发 布 和 管理 功能 可 以 在 Connection 里 一 站 式 操 作 。 用 户 可 以 使 用 
Cognos 报表 的 Web 页 面 的 发 布 功能 、 强 大 的 部 署 能 力 及 负载 均衡 配置 ， 发 布 大 量 的 报表 。 报 
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表 系 统 的 使 用 者 可 以 快速 地 进入 到 公司 日 党 的 统计 分 析 中 ， 报 表 的 数据 可 以 为 公司 的 重大 次 
策 提 供 重 要 的 数据 参考 。 

(3) 快速 的 数据 访问 、 分 析 能 

Cognos 的 解决 方案 是 为 大 企业 、 集 团 公司 的 企业 决策 分 析 系 统 提供 迅速 的 、 准 确 的 处 理 
数据 的 能 力 和 决策 分 析 能 力 ， 从 而 在 变幻 瑞 测 的 市 场 中 抓 住 转瞬 即 逝 的 机 会 。 

(4) 强大 的 安全 性 保障 

Cognos 采用 集中 方式 、LDAP 的 安全 管理 机 制 。 用 户 可 以 在 任何 环境 中 使 用 Cognos 的 
安全 模型 。 该 模型 可 以 灵活 地 与 现 有 系统 的 安全 基础 框架 集成 或 者 整合 。 

(5) 更 多 的 用 户 群 体 

对 于 精通 业务 或 者 具有 财务 背景 的 用 户 来 说 ， 可 以 使 用 Report Studio 的 快速 创建 模式 
来 创建 一 些 简 单 的 报表 ， 还 可 以 使 用 Report Studio 扩展 的 动态 数据 功能 来 满足 业务 的 报表 

对 于 业务 分 析 师 来 说 ， 可 以 使 用 Analysis Studio 提供 的 多 维 分 析 功 能 ， 从 多 个 角度 查看 
数据 信息 。 

对 于 专业 的 开发 人 员 来 说 ，Report Studio 的 增强 功能 将 满足 所 有 需求 。 


16.1.3. ”Cognos 的 现状 


2008 年 Cognos 公司 被 IBM 公司 收购 后 ，IBM 重新 整合 了 Cognos 的 业务 ， 于 2010 EH 
tH f Cognos 10 有 版本。 在 本 书 中 ， 不 对 Cognos 10 进行 讲解 ， 只 针对 Cognos 8 的 安装 与 使 用 
进行 简单 的 介绍 。 

目前 ，Cognos 已 经 成 为 IBM 信息 管理 软件 部 门 的 一 个 事业 部 ,主要 负责 商业 智能 以 及 乡 
效 管 理 方面 的 业务 处 理 ， 成 为 了 了 BM “信息 随 需 而 芝 ” 战 略 的 重要 组 成 部 分 。 


















































16.2 ”Cognos 工 具 浏览 


1. Cognos Connection 

Cognos Connection 是 Cognos 集 设 计 和 管理 于 一 体 的 报表 工具 。 

Cognos 安装 成 功 以 后 ， 用 户 束 可 以 登录 到 Cognos Connection 界面 进行 报表 的 开发 和 管 
BEL 

2. Query Studio 

HPEH Query Studio 可 以 目 定 义 生 成 一 些 徐 单 的 报表 。 在 用 Framework Manager 发 布 
元 数据 模型 之 后 ，Query Studio 束 可 以 使 用 该 元 数据 进行 一 些 简 单 的 运算 ， 以 实现 动态 的 业务 

3. Report Studio 

Report Studio Æ JHP WW JT Ac Ze RJ e MVJT A LR» 其 编辑 和 展示 功能 要 比 Query 
Studio 强大 得 多 。 

4. Analysis Studio 

Analysis Studio 可 以 开发 比较 复 林 的 报表 。 其 分 析 功 能 要 强 于 Report Studio， 但 是 样式 稍 
AK. HIP EIEH Analysis Studio 的 过 程 中 ， 可 以 对 立方 体 模型 中 的 数据 进行 切片 、 钻 取 
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等 专业 操作 。 

5. Event Studio 

Event Studio 可 以 对 事件 发 生 改变 的 条 件 以 及 事件 的 变化 结果 进行 相关 设置 。 比 如 ， 在 每 
天 凌晨 0 点 时 分 发 送 一 封 邮件 ， 每 月 星期 一 早上 6 点 自动 生成 一 份 报表 等 。 

6. Framework Manager 

Framework Manager 是 元 数据 模型 的 制作 工具 。 在 制作 完 元 数据 模型 后 ，Framework 
Manager 还 将 这 些 模 型 发 布 人 到 Cognos 的 设计 环境 中 ， 这 样 Query Studio 和 Report Studio 才能 
正常 地 设计 和 开发 报表 。 

7. Transformer 

用 户 通 过 Transformer 分 析 数 据 源 ， 然 后 建立 维度 和 上 度量， 最 后 生成 立方 体 模型 。 立 方 体 
模型 是 OLAP 分 析 数 据 的 基础 。 

8. PowerPlay 

PowerPlay 用 于 制作 基于 立方 体 数 据 模 型 的 多 维 分 析 报 表 。 

以 上 简单 介绍 了 Cognos 的 工具 ， 下 面 儿 节 将 详细 介绍 这 些 工具 的 使 用 。 


























16.3 Cognos Configuration 


Cognos Configuration 工具 如 图 16-1 所 示 。 





Cognos Configuration — WWW-CF63B08936C kef) 
File Edit View Actions Help 


















Explorer 

B» Local Configuration 

加 -| 三 Environment 

: [B Cognos content database 
日 - 史 Logging 


Environment - Group Properties 












Deployment files location ..Jdeployment 
Data files location [data 
米 Map files location „ {maps 







i File Temporary files location .,Jtemp 
日 l|] Cognos 8 service Encrypt temporary files? False 
区 | Cognos 8 ** Format specification File location ..Jconfiguration/cogformat.xrnl 
PO Portal Services Sort buffer size in MB 4 
&-[8 security Gateway Settings 
Ej (ry Authentication Gateway URI http://localhost:9300/p2pd/servlet/dispatch 
: Cognos Gateway namespace 

IS 啊 Cryptography Allow namespace override? False 

NE Cognos 米 Dispatcher URIs for gateway http://localhost:8300/p2pd/servlet/dispatch/ext 

i Cognos Application Firewall ** Controller URI for gateway http://localhost:80/cognosS/controllerServer 

中 -| 时 Data Access Dispatcher Settings 

[s (ry Content Manager ** External dispatcher URI http://localhost:9300/p2pd/servlet/dispatch 

Po cognos oracle ** Internal dispatcher URI http://localhost:8300/p2pd/servlet/dispatch 

: [ry Notification Dispatcher password Beak 

a Cognos Planning Other URI Settings 

lij] Contributor Data Server ** Dispatcher URI for external applications http://localhost:9300/p2pd/servlet]dispatch 
米 Content Manager URIs http://localhost:9300/p2pd/servlet 
Font Settings 
米 Physical Fonts locations Q ..JbinjFonts; CA WwINDOWSIFONTS 

Physical Fonts map «click the edit button 
Fonts to embed (batch report service) «click the edit button? 
Fonts to embed (report service) «click the edit button 


Specifies the URI to the gateway. 


The gateway must be located on the same computer as a Web server. If you are using ISAPI, change 'cognos.cgi' to 'cognosisapi.dll'. IF vou are using apache mod, 
change 'cognos.cgi' to 'mod. cognos.dll' on Windows, to 'mod  cognos.sl' on HP UX PA-RISC, or to 'mod  cognas.so' otherwise, Use Ehe 'https' or 'http' protocol to 
select SSL or non-SSL communication. The host name portion of the gateway URI must be changed from localhost to an IP address or a network host name. 











图 16-1 Cognos Configuration 工具 
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Cognos Configuration 工具 的 功能 如 下 : 

e 初始 化 Cognos 组 件 ， 包 括 问 口 二、 本 地 URL, LRM, HEAK. 
© 配置 Cognos 组 件 或 者 新 增 组 件 。 

e 在 本 地 计算 机 中 可 以 局 动 、 停 止 、 重 局 Cognos 服务 。 





16.4 Cognos Connection 


Cognos Connection 是 Cognos 8 产品 的 特色 之 一 ， 如 图 16-2 所 示 。 与 传统 报表 工 其 不 同 ， 
Cognos Connection 提供 了 一 套 完 整 的 基于 B/S 架构 的 报表 展示 解决 方案 。 








Public Folders — Cognos Connection 一 Windows Internet Explorer 





bg) REO SEV ERW IAW REO —— 











€ (y yY |E http://1ocalhost:9300/p2Zpd/servlet/dispatch?b action-xts. run&m-portal/cc.xts&gohome- wv 

















» 





w dr Æ Plic Folders - Cognos Connection | | 


W ~ - ih ~ 1 ARBO-OIRO- 
E OCT 








Cognos Connection 

















ES Public Folders My Folders 


| 
Public Folders 


E 31jCf Bf €P ER [à 8 d CU 0 25 


Entries: | | 全 | © 














[]| |Namev 


| Modified $ Actions 


No entries, 











[® &? Internet * 100€ > 


图 16-2 Cognos Connection 界面 








在 Cognos Connection HS F, HAA AIRE, fr. Apr. TE. EEEREN 
据 包 等 功能 进行 设计 和 操作 。 

在 Cognos 报表 的 开发 过 程 中 ， 绝 大 多 数 工 作 都 要 在 Cognos Connection 控制 台中 完成 ， 
包括 报表 的 设计 和 展示 ，Web 页 面 的 位 置 、URL 等 。 以 前 ， 开 发 人 员 与 使 用 人 员 的 显著 区 别 
在 于 : 开发 人 员 在 CS 工具 中 做 系统 的 开发 ， 使 用 者 在 B/S 结构 的 系统 中 使 用 系统 。 现 在 ， 
开发 人 员 的 开发 工作 也 将 转移 到 B/S 架构 的 Cognos Connection 控制 台中 和 完成。 
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16.4.1 


菜单 功能 


AKR Cognos Connection KAMA ILK 16-1. 








表 16-1 Cognos Connection 菜单 


Ui 明 





我 的 目 定 义 区 域 设 置 








加 载 工作 区 ， 单 击 下 三 角 按 钮 ， 在 弹出 的 下 拉 框 中 显示 了 Cognos Connection 整合 的 工具 





Launch 
? - 帮助 文档 
Launch 展开 的 工具 包括 : 


€ Query Studio: 简单 报表 制作 工具 。 

€ Analysis Studio: 报表 分 析 议 计 工 具 。 

€ Report Studio: 复杂 报表 制作 工具 。 

€ Event Studio: 事件 触发 工具 。 

€ Drill-through Definition: P Xf EXCH. 
€ Cognos Administration: Cognos 党 理工 具 。 


16.4.2 AMENE 


默认 情况 下 ，Cognos 分 Public Folders 和 My Folders 
两 个 选项 卡 ， 用 来 存放 Cognos 制作 好 的 报表 ， 如 图 16-3 


所 示 。 当 然 ， 也 可 以 根据 项 目的 实际 需要 来 添加 或 者 删除 














些 选项 卡 来 方便 使 用 。 
16.4.8 ”工具 栏 的 使 用 


AX Cognos Connection 工具 栏 的 介绍 见 表 16-2. 





Cognos Connection pg 


Public Folders My Folders 






Add tabs... 
Remove this tab 
Modify the sequence of tabs... 












图 16-3 Cognos Connection 选项 卡 


表 16-2 Cognos Connection 工具 栏 


说 
以 “列表 ”形式 显示 
以 “详细 信息 ”形式 显示 
新 建文 件 夹 
新 建 Job 


新 建 URL 连接 
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x 
E 


Ui — Hj 
新 建 页 面 
全 部 选择 


全 部 取消 


Ta 
删除 
设置 选项 卡 属性 


E ia 0X [0D P 199 HH i| n 
S: 


排序 


16.5 Query Studio 





Query Studio 用 于 创建 简单 的 得 询 报表 ， 如 图 16-4 所 示 。 其 经 党 使 用 的 功能 如 下 : 
e AWER HE WIZE 

e GJ. 

e 完 羡 简 单 报表 的 视觉 展示 功能 。 

e 使 用 过 滤 、 汇 总 、 聚 合 等 功能 来 处 理 分 析 业 务 数据 。 














Query Studio - New ld 





JOSH AXAD TAIB hAm say 
$ | Font v|[Sze «| Av B I u & El ^ El 





lenu 

Insert Data 

Edit Data 

Change Layout - a 
Title 




















Select and insert items from the tree to fill in the report. 
You can also drag and drop items into the report. 


Report Definition... 


Use Ctrl click to select multiple items in the tree or report. 
Right-click report item headings to access commonly-used actions. 


了 | 


The report item that you selected does not support this action. Select a different report item or action. 








OK 








Internet ® 1008 ~ :: 
图 16-4 Cognos Query Studio 界面 
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有 关 Cognos Query Studio 菜单 的 介绍 见 表 16-3. 


表 16-3 Cognos Query Studio 菜单 
x H8 T x 单 说 明 





Insert Data 动态 显示 模型 在 下 方 动态 显示 已 有 的 业务 模型 
T Filter... 过 滤 


Combine Filters... 编译 过 滤 


aT Sort... 排序 
T Summarize... 汇总 
JA Format Data... 格式 化 数据 


EDF Calculate... m 





| 和 下 铺 取 
Edit Data 
Tm 
Change Layout = 
mm Expand Group 组 展开 
Run Report 
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菜单 T 菜单 说 H 
在 Excel 2000 中 以 单个 Sheet 格式 浏览 
Ju E 

Manage File 保存 
exa 


iA (Calculate). ERK TATH, Hr AAA EEH. VERUS 3 种 操作 
方式 : 

1) A (Arithmetic) 运算 : 包括 加 、 减 、 乘 、 除 、 徊 次 方 ( 义 称 乘 方 )、 绝 对 值 、 平 方 
根 等 ， 见 表 16-4 和 图 16-5. 





表 16-4 Cognos Query Studio Arithmetic 菜单 











TR TE Fi 述 
+ (sum) 为 选 定 的 报表 项 做 加 法 运算 
- (difference) 为 选 定 的 报表 项 做 减法 运算 
* (multiplication) 为 选 定 的 报表 项 做 乘法 运算 
/ (division) 为 选 定 的 报表 项 做 除法 运算 
^ (power) 为 选 定 的 报表 项 做 过 次 方 《又 称 乘 方 ) 运算 
Absolute value 为 选 定 的 报表 项 做 求 绝 对 值 运算 
Round 为 选 定 的 报表 项 做 四 人 法 五 入 运算 
Round down 为 选 定 的 报表 项 做 取 整 运算 
Square Root 为 选 定 的 报表 项 做 平方 根 运 算 
Me UU 
| Arithmetic — s sqrt[abs( 数 量 )) 
ES 3 





Report item: l 
数量 v New item name: 
l © Use the default name 


© | 平方 根 (数量 ) 








Insert Cancel 
图 16-5 Cognos Query Studio Arithmetic 操作 
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2) 百分比 (Percentage) 计算 : 包括 求 特 分 比 〈%)、 上 所 占 总 数 的 百分比 〈% oftotaD. [n] 
脚注 添加 百分比 C96 of footer). 2:290 (增长 率 ) (% difference (growth)), 见 表 16-5 和 图 16-6. 


表 16-5 Cognos Query Studio Percentage 菜单 








HR 4 fü — X 
% 计算 选 定 项 目的 值 ， 以 占 其 他 项 目的 百分比 表示 
% of total 计算 选 定 项 目的 值 ， 以 占 合 计 的 百分比 表示 
% of footer 计算 选 定 项 目的 值 ， 以 占 脚 注 的 百分比 表示 
% difference (growth) 计算 两 个 项 目 之 间 的 差额 (以 百分比 表示 ) 
New calculated report items appear after the last selected item, You can safely delete report items that were used to create calculations, 
Operation type: Expression: 
Percentage v Percentage of total (数量 ) 
Operation: E 
96 of total M 





Report item: | 
数量 v New item name: 
O Use the default name 


G 百分比 (数量 ) 














Insert Cancel 
图 16-6 Cognos Query Studio Percentage 操作 


3) 4Hlr (Analytic) 运算 : 包括 平均 值 (Average)、\ fg X fti (Maximum), f] ME (Minimum), 
排序 (Rank)、 所 占 总 数 的 百分比 〈% oftotal)、 百 分 数 CPercentile). MAM% (Quartile); 
4 NJ CQuantile) 等 ， 见 表 16-6 和 图 16-7. 


表 16-6 Cognos Query Studio Analytic 菜单 



































WR 作 jü 述 
Average 为 选 定 的 报表 项 做 平均 值 运算 
Maximum 为 选 定 的 报表 项 求 最 大 值 运算 
Minimum 为 选 定 的 报表 项 求 最 小 值 运算 
Rank 返回 选 定 的 报表 项 目 中 每 个 值 的 排名 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 排名 
E ”计算 选 定 的 报表 项 目的 每 个 值 上 总 额 的 百分比 。 对 于 已 分 组 的 报表 ， 将 返回 每 个 值 所 鼎 分 组 总 额 或 总 
计 的 百分比 
Percentile 返回 值 的 百分数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 白 分 数 
Quartile 返回 值 的 四 分 位 数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 组 或 所 有 值 中 每 个 值 的 四 分 位 数 
Quantile 返回 值 的 分 位 数 。 对 于 已 分 组 的 报表 ， 将 返回 一 个 分 组 或 所 有 值 中 每 个 值 的 分 位 数 
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Calculate 


New calculated report items appear after the last selected item. You can safely delete report items that were used to create calculations. 


Operation type: Expression: 
Average (数量 , 0) 
Operation: 


Average be 


Selected report items: 








forum New item name: 
©) Use the default name 


ol 0 ý OE 


Number: 








Insert | | Cancel | 





16-7 Cognos Query Studio Analytic 操作 
汇总 《Summarize) 汇集 了 多 种 函数 ， 见 表 16-7 和 图 16-8. 


表 16-7 Cognos Query Studio Summarize 菜单 


区 
BE 


fü — XN 
针对 一 系列 值 的 求 和 
Total 注释 :“ 求 和 ”可 以 返回 的 最 大 值 是 列 数据 类 型 的 最 大 值 。 该 函数 将 反复 执行 “ 求 和 ”函数 。 先 
从 第 一 行 中 获取 值 ， 再 将 第 二 行 的 值 添加 到 函数 ， 然 后 是 第 三 行 ， 依 次 类 推 。 如 果 任 意 点 处 的 中 间 
值 超出 该 数据 类 型 的 最 大 值 ， 那 么 数据 源 将 返回 错误 





























Count 返回 记录 的 总 数 
Maximum 返回 最 大 值 。 当 申请 的 类 型 为 日 期 或 者 时 间 数 据 时 ， 返 回 最 近 的 值 
Minimum 返回 最 小 值 。 当 申请 的 类 型 为 日 期 或 者 时 间 数 据 时 ， 返 回 最 早 的 值 
Average 返回 一 系列 值 的 平均 值 
eae 指定 在 用 于 填充 列 的 表达 式 内 定义 汇总 
注释 : 一 般 认 为 表达 式 本 吴 是 一 个 聚合 函数 ， 并 且 不 需要 修改 就 能 提供 汇总 值 
Automatic 基于 数据 类 型 汇总 值 
Median 返回 选 定 数据 项 的 中 间 值 
Standard Deviation 返回 选 定数 据 项 的 标准 偏差 
Count distinct 返回 唯一 的 非 空 记录 的 总 数 
None 删除 脚注 。 只 适用 于 脚注 值 ， 不 适用 于 明细 
ee e e] 
Set up totals or other summaries. Advanced 


Summary for footers: 
| Calculated {i 














| OK | Cancel | 





16-8 Cognos Query Studio Summarize 操作 
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16.6 Analysis Studio 介 绍 


Analysis Studio 是 Cognos 8 的 OLAP 分 析 解 决 方案 工具 。 它 通过 使 用 问 下 钻 取 (Drill)、 
切片 (Slice) 与 旋转 (Dice) 等 多 维 分 析 功 能 ， 以 局 效率 访问 、 快 速 响应 的 优势 进行 多 维 分 
析 工 作 ， 如 图 16-9 所 示 。 


二 Hew 一 Analysis Studio 一 Windows Internet Explorer 
TFE 编辑 人 于) SEVU KEXA IA 帮助 山 ) 


' =A 7 |Æ http://localhost: 9300/p2pd/ explore explore. htm vi i*+|| X | P~ 





























& k E8|*| t rotae.. ve. x EMEC. ce v. EMER. Ecasv | | A-D 9o oo XEDO-OIAO-" 


File Edit View Settings Run Help 


DBHiügxowa|r-R-iY-E-£f2-|DE Z- BB- | is- i) (3 








Context filter: 


olumns: 


站 产品 名 称 v 








国 sales2 ~ 
a fes 数量 || 欧式 过 地 中 海 家 松木 家] 现代 家 实 林 家 ] IER 中式 家 ] 时 尚 家 ] 田园 家 ] FERE 
用- 加 地 区 和 名称 26 771 116 182 1823 2918 
由 Maj Measures 462 | 558| 652 88 | 1080 | 261 | 450 4697 

956 354 452 820 2582 





统计 日 1146 488 558 2379 442 1532 377 632 2643 10197 





图 16-9 Cognos Analysis Studio 界面 





Analysis Studio 提供 了 交互 式 的 开发 环境 分 析 业 务 数据 , 帮助 用 户 以 最 快 的 速度 找到 解决 
问题 的 方法 。 通 过 Analysis Studio 可 以 做 到 : 
e 答 找 并 定位 用 户 所 关注 的 业务 中 的 重要 信息 。 





e j] 解 业务 的 走势 及 反 香 的 现象 。 

e 通过 对 比 数据 友 现 实际 数值 与 预测 数值 的 差距 。 

e 绩效 评估 (通过 最 佳 和 最 夫 结 果 来 衡量 )。 

e 通过 一 系列 的 计算 来 展示 管理 人 员 需 要 的 重要 信息 。 
e JA. 


16.6.1 Analysis Studio% ZB FX, 


Analysis Studio 由 以 下 几 部 分 组 成 。 
1. 源 目 录 结 构 树 
源 目 录 树 状 结构 显示 了 纬度 、 分 类 、 层 、 虔 量 等 数据 源 信 息 。 
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2. 分 析 项 目的 选项 卡 

分 析 项 目的 选项 卡 包 含 了 所 创建 项 目的 列表 信息 。 

3. 信息 窗口 

信息 窗口 显示 了 名 称 、 类 型 、 级 别 、 聚 合 、 必 性 等 相关 信息 。 

4. 浏览 区 

浏览 区 显示 了 所 有 应 用 的 过 滤器 和 排序 信息 。 

5. 工作 区 

工作 区 用 来 创建 业务 报表 的 展示 信息 。 可 以 在 该 工作 区 中 创建 符合 客户 需求 的 一 系列 与 
业务 紧密 相连 的 报表 ， 例 如 柱 形 图 、 交 叉 图 、 仪 表盘 等 。 

6. 属性 窗口 

属性 窗口 用 来 显示 对 象 的 所 有 相关 属性 。 可 以 在 属性 窗口 中 针对 某 个 对 象 进行 详细 的 配 
置 更 改 ， 以 达到 用 户 最 高 的 满意 度 。 


16.6.2 菜单 功能 


在 Query Studio 荣 单 中 介绍 过 的 内 容 本 节 不 再 性 述 。 本 节 只 介绍 增 量 菜 单 见 表 16-8。 如 
Amm. Wd 16.5. 















































表 16-8 Cognos Analysis Studio 菜单 





菜单 子 菜单 "ED 

New 新 建 
使 用 Report Studio 打开 

iB 
iic 
Lr 
交叉 表 
E 
交叉 表 和 图 表 

选择 图 表 类 型 〈 柱 形 图 表 ) 
选择 图 表 类 型 〈 饼 形 图 表 ) 
选择 图 表 类 型 (线形 图 表 ) 
选择 图 表 类 型 ( 帕 累 托 图表 ) 
选择 图 表 类 型 〈 地 形 图 表 ) 
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菜单 Tox o 说 明 


16.7 Report Studio 介 绍 





Report Studio 是 Cognos 8 的 专业 报表 制作 工具 ， 以 Framework 提供 的 发 布 包 为 基础 进行 
报表 的 开发 ， 如 图 16-10 所 示 。 使 用 Report Studio 可 以 制作 出 任何 复杂 的 报表 ， 比 如 财务 报 








表 、 销 售 报表 、 发 村 报表 等 。 


File Edit View Structure Table Data Run Tools Help 
DEH g% exi 


[Font ~| [sze -|A -iB Ui 


ig e -[al-ie- tis Iv 


z-Bi-ip 8 8i BÁii tui? 
== lI- 


IHE EI&-14-—-[ z]B-1B- € i5 - 4 -| 


[II] 
a 


b 


Text Item 
17-3 Block 
EH Table 


[3b] Field Set 


4a40|dx3 abeg man 


Mal Calculated Member 





EG Calculated Measure 
图 intersection (Tuple) 
ER Query Calculation 


zii 


E: 





Ea Layout Calculation 


图 Image 
LL] Crosstab Space 
C] Crosstab Space (with fact cells) 


FA i:i 
[4] 
= Conditional E 
Conditional Styles 
Style Variable 
-| Box 


Border v| 




















Double click to edit text 


CE EE EE ET EE EEE | 





abc abc abc ss abc abc abc 
fos titles: 


Category: 0x-8208): 
2E 


eh inis i aij ah nih i uh ah Rai uh s dad dei duc ded duc ded duci ded demi du cd demi duc du mi duc du i duc du d du cm dmi is ah Ru Rs ah Ra Rs ah ah ah ah i he a hd ah i hn a ah ah Rs ah ah d du dd dn. dnd dh dn n nh d t 





完成 


Internet 100% 7 


图 16-10 Cognos Report Studio 界面 
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Report Studio 提供 了 两 种 创建 模式 。 

1. 专业 创建 模式 

专业 创建 模式 为 用 尸 提 供 了 最 大 功能 的 访问 权限 。 用 户 可 以 使 用 多 种 数据 产 ， 进 行 任何 
复杂 的 报表 制作 ， 比 如 地 图 、 多 表 头 报表 等 。 在 该 模式 中 ， 不 能 达 看 动态 数据 信息 。 

2. 快速 创建 模式 

快速 创建 模式 为 用 户 提 供 了 简单 而 集中 的 Report Studio 界面 。 即 使 开发 人 员 不 太 了 解 业 
务 ， 也 可 以 创建 传统 的 财务 和 管理 报表 。 该 模式 的 权限 仅 限 于 访问 投 维 度 建 模 的 数据 和 使 用 
面 同 成 员 的 数据 树 结构 。 

这 两 种 模式 在 实际 开发 中 可 以 进行 切换 , 前 提 是 用 ome 
户 有 足够 的 权限 访问 这 两 种 模式 。 一 般 情 况 下 ， 使 用 快 = d sues 

















速 创建 模式 创建 报表 ， 然 后 切换 到 专业 创建 模式 进行 更 i om 
多 信息 的 设置 。 Jin 
16.7.1 Report Studio 的 组 成 qo 





Report Studio 工作 区 由 以 下 儿 个 部 分 组 成 。 
1) Insertable Objects (可 插入 对 象 工 作 区 ) 包括 以 
下 3 个 部 分 。 




















Source: 业务 源 信息 显示 ， 如 图 16-11 所 示 。 - ME BEC 
Data Items: 显示 工作 区 中 的 查询 主题 ,如 图 16-12 
Bs 显示 工作 区 中 的 得 询 主题 ， 如 图 K| 16-11 Cognos Report Studio Insertable 
an uu o Objects Source 工作 区 
Toolbox: 页 面 布局 按钮 及 对 象 ， 如 图 16-13 PR. 
Insertable Objects 
3 Quervi Text Item ~ 
Task eed 
T 地 区 名 称 adi 
T 统计 日 其 EH Tabie 
[ab] Field Set 
a Calculated Member 
EW Calculated Measure 
E Intersection (Tuple) 
E Query Calculation ~| 
B T ou s T É 
| 16-12 Cognos Report Studio Insertable | 16-13 Cognos Report Studio Insertable 
Objects Data Items 工作 区 Objects Toolbox 工作 区 





可 插入 对 象 说 明 见 表 16-9. 


表 16-9 可 插入 对 象 说 明 








可 插入 对 和 象 Hox 
Text Item 报表 中 的 一 个 条 目 。 内 容 可 以 是 静态 的 文字 ， 也 可 以 来 自 一 个 查询 条 目 或 报表 的 表达 式 
Block 添加 空 块 ， 访 块 是 可 以 插入 其 他 对 象 的 容器 。 这 对 控制 对 象 的 显示 位 置 非 党 有 用 





224 


可 插入 对 象 
Block 


Table 
Field Set 
Calculated Member 
Calculated Measure 
Intersection(Tuple) 
Query Calculation 


Layout Calculation 


Image 


Crosstab Space 


Crosstab Space(with fact 


cells) 


List 
Crosstab 
Chart 
Map 


Repeater Table 


Repeater 
Singleton 


Conditional Blocks 


HTML Item 


Rich Text Item 


Hyperlink 
Hyperlink Button 
Date 


Time 


As of Time Expression 


Page Number 


Row Number 


Layout Component 
Reference 


Metric Studio Diagram 


jü 述 
提示 : 用 户 可 以 使 用 块 在 对 象 之 间 添 加 空格 。 但 是 ， 空 块 不 会 显示 出 来 ， 必 须 插 入 对 象 或 指定 高 








度 和 宽度 








添加 表格 ， 该 表格 是 可 以 插入 其 他 对 象 的 容器 。 这 对 控制 对 象 的 显示 位 置 非常 有 用 
添加 具有 标题 的 空 块 。 这 与 “ 块 ” 对 象 类 似 ， 但 是 具有 标题 

添加 已 计算 的 成 员 

添加 已 计算 的 度量 

添加 交集 〈 数 组 ) 

添加 已 计算 的 列 

在 包含 运行 时 信息 《例如 当前 日 期 、 当 前 时 间 和 用 户 名 ) 的 布局 中 添加 计算 


添加 图 像 对 象 
一 个 指向 图 像 文件 的 链接 。 该 链接 可 以 是 一 个 静态 值 ， 也 可 以 来 日 一 个 报表 表达 式 或 仁 询 项 目 。 











使 用 图 像 的 对 象 来 定义 链接 的 URL 源 属 性 





在 交叉 表 边 缘 上 插入 空 单元 格 。 允 许 在 边缘 上 插入 非 数据 单元 格 。 报 表 运 行 时 会 显示 边缘 的 空 单 


元 格 





如 果 区 叉 表 边 缘 没有 有 用 的 数据 ， 而 用 户 和 希望 改 为 在 单元 格 中 显示 空白 ， 则 插入 该 对 象 
在 交叉 表 边 缘 上 插入 空 单元 格 。 人 允许 在 边缘 上 插入 非 数据 单元 格 。 在 添加 度量 或 指定 默认 度量 后 ， 


将 在 边缘 上 生成 资料 单元 格 





如 末 已 垦 套 交叉 表 空间 ， 则 资料 单元 格 的 范围 为 位 于 空间 前 的 级 列 上 的 项 目的 范围 

如 果 未 嵌 估 交叉 表 空 间 ， 并 且 其 下 不 存在 任何 柑 僚 项 目 ， 则 资料 单元 格 的 范围 为 默认 展 量 
一 个 布局 对 象 ， 目 的 是 加 入 下 一 个 列表 

一 个 交叉 表格 布局 对 象 ， 用 于 提供 一 个 查询 、 汇 总 数据 ， 然 后 排列 在 一 个 二 维 网 格 中 
添加 一 个 岁 表 对 和 象 

Ad JI fs HI ts P Fer cds FI EEG E 


AS ILE ide eG] ZR 
但 询 表 中 的 数据 呈现 


WIEREN E 

插入 单一 数据 项 对 象 

添加 可 用 于 条 件 格式 化 的 空 块 对 象 

深 加 可 以 插入 HTML 代码 的 容 右 。HIML 项 目 可 以 是 浏览 右 将 执行 的 任意 项 目 ， 包 括 链 接 、 和 网 
































像 、 多 媒体 、 工 具 提 示 或 JavaScript。 仅 当 以 HIML 格式 运行 报表 时 才 显 示 HTML MH 


ik: HTML 项 目 中 不 能 包括 <form> 标签 
插入 用 于 在 布局 中 显示 HTML 的 对 象 。 该 对 象 与 “HTML 项 目 ” 类 似 ， 但 是 富 文本 项 目 也 可 以 











在 PDF 输出 中 显示 。 将 在 数据 源 中 定义 的 注解 添加 到 报表 时 ， 使 用 语文 本 项 目 非 常 有 用 


HE: 是 文本 项 目 仅 支持 受 限 的 格式 正确 的 XHTML 集合 
添加 超级 链接 以 便 用 户 跳 至 其 他 位 置 (例如 网 站 ) 

以 按钮 的 形式 添加 超级 链接 

湛 加 报表 运行 的 日 期 对 象 

添加 报表 运行 的 时 间 对 象 


添 加 一 个 可 以 产生 日 期 -时 间 值 的 表达 式 
该 表达 式 产生 一 个 日 期 -时 间 值 。 这 个 表达 式 可 以 用 来 显示 一 个 特定 时 期 内 ， 由 创建 的 表达 式 定 














义 的 报表 结 来 


插入 可 以 目 定 义 的 页 码 对 象 
报表 运行 时 ， 每 行 数据 返回 的 编写 对 象 
注 : 可 以 仪 将 行 号 添加 到 列表 和 重复 需 


将 引用 添加 到 其 他 对 象 。 当 重复 使 用 对 象 时 非常 有 用 
添加 Metric Studio 历史 记录 图 表 作 为 图 像 
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可 插入 对 象 描 x 
Table of Contents 创建 在 报表 输出 中 生成 的 目录 对 象 
Table of Contents Entry 添加 目录 标记 
Bookmark 插入 书签 ， 以 便 用 户 从 报表 的 一 个 部 分 移 至 另 一 部 分 
Text Box Prompt 一 个 控制 器 ， 人 允许 用 户 在 值 中 定义 类 型 
Value Prompt 允许 用 户 从 列表 中 选择 一 个 或 者 多 个 值 的 提示 控制 


Select ar Search Pompi 一 个 控制 占 ， 按 照 需 要 的 搜索 规则 确定 一 个 选择 范围 。 用 户 不 能 使 用 此 SAP. BW 的 数据 源 提 未 
Tias 




















Date & Time Prompt 一 个 控制 器 ， 用 户 可 以 选择 一 个 日 期 和 时 间 值 

Date Prompt 一 个 控制 器 ， 用 户 可 以 选择 一 个 日 期 值 
Time Prompt 一 个 高 级 的 控制 ， 允 许 用 户 选 择 一 个 时 间 值 

Interval Prompt 一 个 高 级 的 控制 ， 用 于 间隔 时 间 的 提示 
Tree Prompt 个 控制 器 ， 显 示 分 层 信息 ， 并 允许 选择 一 个 或 多 个 成 员 

Generated Prompt 一 个 控制 器 ， 作 为 一 个 占 位 符 的 行为 
二 使 用 预先 定义 的 按钮 提 不 外面。 它 的 用 法 的 变化 ， 根 据 其 类 型 属性 ， 可 以 设置 为 取消 、 上 一 步 、 
下 一 步 、 完 成 或 重新 提示 


2) Page Explorer CHH AVE Ear) 工作 区 如 几 16-14 PR- 
3) Query Explorer (AWA EMA) 工作 区 如 图 16-15 Drs. 


Page Explorer x 











FHA Report Pages 
- (Sg Queries 
J Prompt Pages mm 
E Classes UU] Qusry2 








图 16-14 Cognos Report Studio Page Explorer 工作 区 ”图 16-15 Cognos Report Studio Query Explorer 工作 区 








选择 条 个 合 询 主题 ， 系 统 会 日 动 切换 工作 区 ， 如 图 16-16 PR. 
| Data Items | (Detail Filters 
T 产品 名 称 
T 地 区 名 称 
T suit ARA 


E Summary Filters 


(a Slicer 














图 16-16 系统 自动 切换 工作 区 


226 


4) Condition Explorer (ZAF AI E EAr) 如 图 16-17 所 示 。 


Condition Explorer x 





= Variables 





(No variable) 


图 16-17 Cognos Report Studio Condition Explorer 工作 区 


16.7.2 ”菜单 功能 
Report Studio 是 专业 的 报表 开发 工具 。 有 关 Cognos Report Studio 六 单 的 介绍 见 表 16-10. 








a 16-10 Cognos Report Studio 菜单 





x 5 T os m 说 ^ 8j 
New 新 建 
m 
Cut BIW) 
Edit 
| Professional 和 Express 两 种 模式 
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View 


Structure 


Table 


Data 


Tools 


Prompt Pages 

Queries 

Variables 

Classes 

Page Design 

Page Structure 

Toolbars 

Panes 

Visual Aids 

Group/UnGroup 

Swap Rows and Columns 

Set Page Break 

Set Page Break Using Master/Detail 
Section 

Section Using Master/Detail 
Headers & Footers 

Pivot List to CrossTab 
Covert List to Repeater Table 
Convert Chart... 

Insert Table of Contents Entry 
Lock Page Objects 

Create CrossTab Nodes 
Insert 

Delete 

Select 

Merge Cells 

Split Cell 

Apply Table Styles... 
Calculate 


Filters... 


Sort 

Aggregate 

Insert Children 

Master Detail Ralationships 
Drill Behavior 

Default Data Formats... 
Validate Report 

Validate Options... 


Auto Correct... 


说 — Hj 





显示 提示 页 面 
显示 查询 主题 
显示 变量 
显 不 类 
页 面 设计 
页 面 结构 
显示 工具 栏 

显示 和 面板 

可 视 区 域 设置 

分 组 /取消 分 组 

行列 互 换 

设置 页 面 断 点 

使 用 主 /明细 设置 页面 断 点 
分 段 

使 用 主 /明细 分 段 

在 分 组 时 插入 表 头 / 表 尾 
将 列表 转换 成 交叉 表 

将 列表 转换 成 Repeater 表 
转换 成 图 表 

插入 目录 项 

锁定 页 面 对 象 

创建 交叉 表 节 点 

插入 

删除 

选择 

合并 单元 格 

拆 分 单元 格 

应 用 表格 样式 

计算 

排序 


PX A 
聚合 


插入 子 集 

主要 明细 关系 
钻 取 行为 

默认 数据 格式 
验证 报表 

验证 选项 

目 动 校 验 正确 性 


i 


x 5 T 3s om 说 W 
Show Generated SQL/MDX 显示 生成 的 SQLMDX 
Show Specification 显示 明细 
Show Specification (Selection) 显示 《可 供 选 择 的 ) 明细 
Open Report form Clipboard A BW ETATE 

Tools Copy Report to Clipboard 复制 报表 到 剪 由 板 

Manage Conditional Styles... 条 件 样 式 管理 
Layout Component Cache... 布局 组 件 缓存 
Build Prompt Page 创建 提示 页 
Options 选项 


16.8 Event Studio 介 绍 








当 业 务 中 的 某 个 事件 发 生 时 ， 需 要 触发 一 个 事件 来 响应 该 事件 ， 这 时 候 束 需要 用 Event 
Studio C JL] 16-18) 通知 事件 中 的 决 全 者， 以 便 系 统 使 用 者 快速 准确 地 做 出 决策 。 


File Edit View Insert Actions Help 


DEHRU BAXA 0 Mh- D- EK 

















Event: Tasks: 


| 
*$* Specify an event condition... ie 4d 
Add a task v - MEE 
D Manage the task execution rules... 
"p Specify an event condition 


fix) Functions box. When the agent detect: 


nes an event by selecting or dragging insertable objec ping items, functions, parameters, and values in the event 
ts this event, it performs each task that meets the task es. 
33- CJ Operators 


cts, or by ty 
k execution rul 



























Detail Summary Ei E E 
+E summaries 
Use the Detail tab to create an expression that is applied to the values in the data source. 
-EI Member Summaries 
-E Constants — 一 - Eee u 
umb) (Define an event by selecting or dragging insertable objects, and/or typing items, functions, parameters, and values required. 
&-(E* Constructs 
an if then else 
all in range 
a search case 
E simple case 
33- [Z3 Business Date/Time Functions 
&- [CJ Block Functions 
&j- C Vendor Specific Functions 
-EI Common Functions 
Information: 
[finance].[monthly].[code] = 'A' and [finance].[monthly].[amount] > ?parameter? 
Use items, functions, parameters, and values to build an expression. 
Tips Error 
s T T Q 
完成 Internet "10038 v 


图 16-18 Cognos Event Studio 界面 


Hi P "asreyeg gp]; OV AE SHIT. SREM HRE, TE 
触及 一 系列 动作 ， 比 如 发 送 短信 提示 给 负责 人 、 将 信息 记录 发 送 邮件 、 运 行 茶 个 事先 开发 好 
的 报表 等 。 


16.8.4 Event 介绍 


在 处 理事 件 的 时 候 ， 首 先 需要 为 该 事件 添加 一 个 Event 的 触发 条 件 ， 比 如 转账 金额 大 于 
10 万 元 人 民 币 、 单 笔 区 易 金 额 超 过 100 万 元 人 民 币 、 当 天 在 线 人 数 素 计 达 30 万 人 次 等 。 本 例 
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中 ， 将 销售 案例 中 的 “数量 ”>100 作为 事件 触发 条 件 添加 到 表达 式 中 ， 如 图 16-19 所 示 。 
只 有 添加 了 该 事件 的 触发 条 件 ， 系 统 才 会 执行 下 面 介 绍 的 几 种 触发 类 型 的 任务 。 






IED RAP eo cmxg IAT Wi 
GE - E| bitp fllacalbazt TODO p pd! narvai di spatctdl w t K | ps 


Wr od BA gae rudes. dFÜÉÜNe cde. x Freud,  (WMISR —giÉwaen- | uc W NEO- GIAN- 








File i-r Loa] Tirsa-ri Radir Hra 


DOHe xg&&xooc E»- 5-HÓ 
| Em s rua 
ua 
可 nene 
- Specify an event condition 


à cach tank Phal meets t ceu b 
Detail AET z B m m 
lad tab in goait an caza Pus bi dod bs se volue n Pr dala surtt 


[Fmance].[ menthhy [code] = A and [finanmce].[ monti] [ameunt| = parameter? 


Use items, fumctons, parameters, and values tn bold an exceespion 
i Interzat * qwe = 


16-19 Cognos Event Studio Event 触发 条 件 举例 


16.8.2 Task 介绍 


1. Email 

顾名思义 ，Email 束 是 发 送 邮件 任务 。 当 该 事件 被 触发 时 ， 系 统 会 目 动 发 送 该 Email 给 日 
定义 的 用 户 ， 同 时 抄 送 一 份 该 邮件 给 抄 送 者 。 例 如 ， 发 送 邮 件 给 chinalgf@126.com， 同 时 抄 
送 一 份 给 wangfei5673@sina.com， 如 图 16-20 所 示 。 








THG Sm 900 quERQ) TAT WR 


o: y E bui I lasulhest 8X0 / gg aes aU Mi sgatehlt im E LE D| 
b= 


"d He m res ide-deo x £*e-&ey  WHWIER —QWENE- | H- Do ND-OIAO- 





[=] Specify the email to send 
is rim rm às ig anii rni ua mr 


3pscify n fu akt ? mcm k Salai: Tua rop emn n cw hye Pe PT ns pe om a i 


Tin 
=b chinalof 125 cen 
iü 
m nghe? 3 sns. com 
prec he miri iN Bu 


buhperct: 


= AESA 
Body: com BB L EENE EEE B s 
= Hello, » 
Dai - p 154952171 8L TE 
End = 
Hh = Addis, 
zu ÉD Internat tix. o 


16-20 Cognos Event Studio Tasks 触发 条 件 举例 
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2. News Item 介绍 


有 时 ， 当 一 个 事件 发 生 时 ， 需 要 在 Web 页 面 发 布 一 些 消 恩 或 者 新 闻 。 这 时 ， 就 需要 创建 
一 个 News Item 来 满足 要 求 ， 如 图 16-21 所 示 。 





xq auc meo SEG IAT Whw 

- — 一 -一 一 一 E — s EETU T T 
ga- [B biap /Floralhort MON pipa vervlat/ di spatchdl ESI EE ER [ern | Pas 
一 ?一 "一 - - f atom a _ , —— —, n 种- 
9r 4r Eal gg apraun s Dee- e. x Exe ur | WBCOR — BwEWE- —— 0 5o o c o TED-OIAS- 





Für Fit — View lnxert — Actis — Help 


DEHA :umnmnBxoo EB» Bn-HMU 


Donc as 





Specily the news item bo publish 


Rescihy Hut heads bant, ini try ark kd F aaia ol ha ra lem, Vau can IU PI Io a eat. The handie, areen byr. aiai benl gan havs Dauer oilani bj u 


A E E i 
he spani ist, The agent edi oubbeh thé need iiem ehen it detects events and de ttm That hee Mosh execubon rules ne mt, 


Veaedlina-- u 
= ERATE | 


Screen tp 


= Wt 


Text; 
=> PrEbVÁEI MIXTE. 
Limk to: 
Select to vien ts agents event st, pn entry or a UAL ser es sien ddie Hue ness sem bendine. News list location: 
(QC Event Lait tuse 
Eniey: 
+ 





16-21 Cognos Event Studio New Item 创建 


3. Report 介 绍 
创建 Report 如 图 16-22 所 示 。 


F Her Epent Studio LE Imternet Explorer 

XMD MI ETO MAW IAW EMW 

G-- [| bap: I LocaThost ON pep serviat di sputchd — Bil*elE] [5 leis 
MI => = = == : s x 

wow (EB Fmy se Pie -… 工务 an o FÜR cs FÉ WEICO —$ wA m- O mept- GIA- 








ir è Eit Wiw lnmxcrt Artine — Help 


(5:5 gue r:maxoo | 加 上 =| 二- 国医 


Ses 








le: T ow - Ó |useavalue v. Defaut 
boss" 十 了 m z 
a *T [5 m mia : 
n: ps | B Ineernet LUNAM 





16-22 Cognos Event Studio Report 创建 
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4. Job 
一 个 作业 可 以 包括 多 个 报表 、 报 表 视 图 或 者 其 他 作业 ， 它 的 创建 如 图 16-23 所 示 。 可 以 





在 实际 使 用 过 程 中 将 一 系列 的 行为 打包 成 一 个 作业 来 作为 任务 。 


DHew — Event Studio — Windows Internet Explorer 





THEO 编辑 于) SEVU KERA IAT) RH) 








€ GA T ēl http ://localhost:9300/p2pd/servlet/dispatchë ~ 好 || X |E | p 





X 4 eB. Quy raa... Bi x | 后 aa | Ner jn. (eium. 区 销售 明细 二 | | O- E) 9 2XED- GIRO: a 
File Edit View Insert Actions Help 


DGBHu:!/xxtgmüexoo | 区 bv- | B EE 


























Event: Tasks: PR o 
Spe le 4i d i E E 1 
— || 路 晶 >100 WERS 产品 销售 区 域 2 销售 明细 dmm 
Ò Reorder the tasks... Mav 
Navigate the folders or search to find the job to include in the agent. Search 
国产 品 销售 区 域 2 Cognos > Public Folders 


zi Wü SALES 


W 产品 类 型 
因 地 区 名 称 





T it ARA 


sm | mA 
完成 





li NIU E 
图 16-23 Cognos Event Studio Job 创建 

5. Agent 介 绍 

Agent (代理) 用 来 监控 实例 的 数据 并 在 事件 发 生 时 执行 指定 的 任务 。 代 理 运 行 时 ， 会 检 
得 事 件 的 发 生 条 件 是 否 满足 。 如 采 满 中 代理 执行 的 条 件 ， 那 么 将 执行 指定 的 任务 。 代 理 的 运 
行 任 务 有 了 两 种 方式 : 一 是 同时 执行 全 部 任务 ， 二 是 按照 指定 的 方式 顺序 执行 任务 。 

6. Advanced 介绍 

€ Database Update〈 数 据 库 更 新 ): XEDREZIS JG Fe Hn ERR tL REO EGREGII] 7 3 e 

€ WebServices (Web 服务 ): 使 用 Web Services 服务 的 方式 。 

€ Export CFE): 可 以 将 选项 导出 到 指定 的 位 置 。 

€ Import CZA): 可 以 将 选项 导入 到 目标 位 置 。 

€ Content Maintenance Task (ARHI): 内 容 存储 库 的 维护 方式 。 

€ Migration Task. (EERE): 虚 量 标准 的 操作 方式 。 























16.9 Framework Manager 建 模 工具 


Framework Manager 是 用 来 组 织 和 友 布 元 数据 模型 的 工具 ,模型 是 包含 了 物理 信息 和 业务 
信息 的 一 个 或 多 个 数据 源 的 元 数据 集合 ， 为 报表 应 用 提供 维度 、 玛 询 主题 和 其 他 相关 的 信息 ， 
如 图 16-24 所 示 。 
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2 Sales4 — Framework Manager 





File Edit View Project Repository Actions Tools Help 





























D| e H Ed- B ES" d 
Sales4 
Project Viewer Dx Tools ox 
= ia Sales4 B Sales4 £ Summary fa Search & Dependencies 
- BI TARGET 
- Wü SALES 
WM ID 首 BI_TARGET Design Language 
四 产品 名称 英 立 
四 产品 类 Š= Explorer 9 Diagram 加 Dimension Map P 
ML 一 一 全 一 Active Language 
E xg (83) Data Sources E 
me 统计 日 其 
d dcin NEN — | 
H- Parameter Maps faal Parameter Maps 
- (iG Packages Class Count 
GÀ) salesd4 Namespace 1 
是 | packages lll] Query Subject 1 
(I| Query Item 6 
B Data Source 1 
{E Package 1 
Total 10 
Properties Bx 
Properties | Language 
aoff... 
完成 NUM 


图 16-24 Cognos Framework Manager 界面 


模型 提供 了 一 种 与 源 数 据 的 信息 相关 的 业务 视图 ， 用 来 创建 、 分 析 和 查询 报表 。 该 业务 
视图 可 以 : 

e 组 织 条 目 。 

e 使 用 数字 、 货 币 、 日 期 、 时 间 等 进行 条 目的 格式 化 。 

e 多 语言 的 配置 ， 比 如 条 目 名 称 、 描 述 、 数 据 等 选项 。 

e 将 自动 生成 的 SQL 查询 发 给 关系 型 数据 源 。 

e 默认 提示 设置 。 

特别 地 : 

e 可 以 修改 Framework 中 的 模型 来 确保 查询 能 及 时 、 安 全 、 多 形式 、 有 效 地 发 给 数据 源 。 

e 还 可 以 指定 合 询 的 规则 ， 限 制 用 户 访 问 数据 中 特定 的 行 或 列 。 

e 另外 ， 数 据 关 系 模 型 还 可 以 为 用 户 隐 藏 复杂 的 数据 。 


16.9.1 菜单 介绍 


AX Cognos Framework Manager KAHJA ILK 16-11. 

















表 16-11 Cognos Framework Manager 菜单 
Xo T X 4 说 H 
New 新 建 
m 
File 
关闭 
关闭 所 有 
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File 


Edit 


View 


Project 


Repository 
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Save 

Save As 

Save All 
Manage Project 
Page Setup... 
Print Preview 
Print 

Exit 

Undo 

Redo 


Q 
= 


t 

Copy 

Paste 

Delete 

Rename 

Select All Simple Objects 
Go To 

Project Viewer 
Properties 

Tools 

Status Bar 

Refresh 

Verify Model... 
Language 

Project Function List... 
Edit Governors... 
Evaluate Automatically 
Branch to... 

Merger from... 

Sessions Parameters... 
Logon As... 

Logoff... 

View Transaction History... 
Run Script... 
Synchronize... 

Create Segment... 

Link Segment... 


Get Latest Version 


说 ^ 8j 
保存 
AMEN 
保存 所 有 
管理 工程 
页 面 设置 
TT ERU 
打印 
退出 
撤销 
重 做 
BIH 
复制 
粘贴 
删除 
重 命名 
选择 所 有 人 简单 的 对 象 
跳 转 (返回 、 前 进 、 向 上 一 级 、 模 型 根 元 素 ) 
显示 工程 视图 
显示 属性 窗口 
显示 工具 窗口 
显示 状态 栏 
刷新 
模型 验证 
选择 语言 
工程 函数 列表 
编辑 
自动 评估 
拆 分 
合并 


会 话 参 数 








注销 

但 看 事务 历史 
运行 脚本 
同步 

创建 段 
链接 段 
获取 最 新 版 本 


Repository 


Actions 


Tools 


Help 


Check Out 

Check In... 

Undo Check Out 

View History 

Add Project To Repository... 
Connection Manager... 

Create 

New Parent 

Edit Definition... 

Merge in New Query Subject 
Merge in New Regular Dimension 
Define Query Set... 

Format... 

Convert To Query Subject 
Convert To Data Source QuerySubject 
Convert To Regular Dimension 
Convert To Measure Dimension 
Remap To New Source 

Edit Package Inclusion... 
Specify object Security... 

Run Metadata Wizard... 

Export Model... 

Package 

Test 

Verify Selected Objects... 

Run Model Advisor... 

Show Object Dependencies... 
Create Star Schema Grouping... 
Detect Relationships... 
Determine Aggregation Rules 
Determine Object 

Find Report Dependencies 
Find All Secured Object 

Model Report... 

Content 

About Framework Manager 


Cognos on the Web 


Ui  — 8j 
S EH 
他 入 
撤销 检 出 
查看 历史 
添加 工程 到 知识 库 
连接 管理 
创建 
新 建 父 集 
编辑 定义 
在 新 查询 主题 中 合并 
在 新 规则 的 维度 里 合并 
定义 查询 集 
格式 化 
转换 成 查询 主题 
转换 成 数据 源 查 询 主题 
转换 成 规则 的 维度 
转换 成 度量 的 维度 
重新 映射 到 新 源 
重新 编辑 包 
指定 对 象 安全 性 
运行 元 数据 问 导 
导出 模型 
包 
测试 
验证 选择 的 对 象 
运行 模型 顾问 
展示 对 象 依赖 
创建 星 型 结构 分 组 计划 
查询 对 象 之 间 的 关系 
确定 聚合 规则 
确定 对 象 
查询 报表 依赖 关系 
查询 所 有 安全 的 对 象 
模型 报表 
上 下 文 环境 
关于 Framework 管理 器 











Web 上 的 Cognos 
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16.9.2 ”工作 区 


1. Project Viewer 


Project Viewer Ot H AAS) "ll 16-25 Drs. 
Project Viewer 中 的 模型 〈 元 数据 集 ) 包括 以 下 各 主题 。 


e 命名 空间 : 对 象 的 容器 集 。 
e 数据 源 ， 定义 数据 源 。 


e 参 效 映射 : 在 报表 运行 时 ， 使 用 参数 创建 可 答 换 的 得 询 主题 。 


e 包 : 定义、 修改、 发 布 包 等 操作 。 


2. Project Info 


Project Info CH HFR) 是 Framework 的 建 模 工作 区 ， 可 以 创建 查询 主题 、 








系 、 设 计 维度 及 度量 等 ， 包 括 以 下 内 容 。 


1) Explorer: 显示 但 询 主 题 定义 ， 如 图 16-26 pm. 


Project Vierer 


-- [f| BI, TARCET 
x T SALES 
WI p 

WM AEF 

WM 产品 类 型 


M m Sn 
B xs 


二 后] Data Sources 
*-[EF]] Parameter Maps 


- fri Packages 
Hu sie d 


| 16-25 Cognos Framework Manager 
Project Viewer 工作 区 





= Explorer | € Diagram |[[[] Dimension Map 


i 
SALES 


儿 16-26 Cognos Framework Manager 


Project Info Explorer 工作 区 


2) Diagram: 模型 关系 定义 ， 如 图 16-27 Win. 








lorer ge Diagram | 四 Dimension Map 


图 16-27 Cognos Framework Manager Project Info Diagram 工作 区 
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定义 模型 天 








3) Dimension Map: 维度 和 上 度量 的 定义 ， 如 网 16-28 Pr. 


i= Explorer | ge Diagram m Dimension Map | 
Dimensions - Scope Mode (Multiple) | TE «| » | 
十 日 期 产品 名 称 。 地 区 名 称 | 数量 
十 日 期 产品 名 称 地 区 名 称 L xg 
9 其 (A11) 产品 名 称 (A11) 地 区 名 称 (A11) 
十 日 期 产品 名 称 地 区 名 称 
«| |» 
图 16-28 Cognos Framework Manager Project Info Dimension Map 工作 区 


3. Properties 


Properties CE). 用 于 定义 各 奏 询 主题 的 属性 ， 如 图 16-29 所 示 。 


Properties 


Properties | Language 


Hame 
Description 
Last Changed 
Last Changed Br 
Hodel Comments 
Screen Tip 


Securitr Filters 


SALES 


2e007-05-25T14:43:30 


Anonymous 


«Click to edit.» 


Exrternalize Method iqd 
Exrternalize uto Summary false 
Status Valid 


图 16-29 Cognos Framework Manager Properties 工作 区 


4. Tools 
Tools (TĦ) 包括 以 下 3 个 选项 卡 。 


1) Summary (à): 分 Project. Statistics. Tasks 三 个 标签 ， 如 图 16-30 所 示 。 其 中 ， 








Project 显示 活动 的 语言 信息 ,Statistics 统计 对 象 的 数量 信息 , Tasks 可 进行 一 系列 任务 的 操作 。 
2) Search Cri: 依据 条 件 得 询 对 象 等 ， 如 网 16-31 所 示 。 
3) Dependencies《〈 依 赖 ): AWERI ZAKR, WB 16-32 IR. 
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Tools E X 





E Summary fal Search & Dependencies | Summary f] Search | 总 Dependencies | 

ES | Search string: 9 found [^ Subset 

Design Language [EE z] Search | v| 
英信 

Active Language Condition: contains 


Search In: BI TARGET 
Search Class: (All Classes) 
Search Property: (All Properties) 


[英文 -| 


ie Count [四 sese pum 5BI_TARE. .统计 日 期 
> P 统计 日 其 BI_TARG... ”统计 日 其 
Wee 1 .统计 日 期 BI_TARG. . .统计 日 其 

ggg Query Subject 1 统计 日 期 (Al11) BI_TARG. . .统计 日 期 (A11) 
[IW] Query Item 9 ca 统计 日 期 BI_TARG... 统计 日 期 

TP Dimension 了 [四 统计 日 其 5I_TARE. .统计 日 期 

I, Measure 1 M 统计 日 期 BI TARG... [BI TARGET]... 
8a Scope Relationship " 里 统计 日 期 <.. ， 5I_TAKE. .统计 日 期 <=>... 
二 里 。 统计 日 期 <... BI TARC... — [BI TARGET]... 
BI TARGET 


Run Metadata Wizard... 


Find Report Dependencies 
SALES 


Edit Definition... 
Find Report Dependencies 


Bulk Replace... | 


16-30 Cognos Framework 16-31 Cognos Framework 
Manager Summary 工作 区 Manager Search 工作 区 











Summary Ez Search & Dependencies | 


Select an object to view its dependencies 


Drag & drop an object from the Project 


Viewer here to view its dependencies. 


Dependent objects 


No Dependencies Found. 





[ Show Object Id 
16-32 Cognos Framework Manager Dependencies 工作 区 
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16.10 Transformer4T Z8 


Cognos Transformer 以 多 维 檬 型 的 设计 理念 方式 将 多 种 数据 源 (Source) 转化 为 立方 体 
(Cube)， 如 图 16-33 Bras. 


嘱 Transforaer — SALES2. py j 





File Edit View Run Diagram Tools Security Window Help 


|hDB8BH& o4:u-oBBESE:SGg6 













lll Dinension Nap 加 回国 A Signons [- [e] x) 
© 统计 日 期 地 区 名 称 ger 






illl Data Sources BE | l- elx) ^ PowerCubes 
liil fka Zr i Sales 


BE * Custom Views BAA 


g 
(M 统计 日 期 





Ready T 中 " 4 P d 


16-33 Cognos Transformer 界面 





Cognos Transformer 将 业务 分 成 若干 维度 ， 每 个 维度 下 包括 分 类 和 多 个 层 结构 ， 用 度量 值 
来 衡量 业务 的 成 效 。 


16.10.1 Data Sources 





Data Sources〈 数 据 源 ) 窗口 用 于 模型 的 数据 源 设置 ， 如 图 16-34 所 示 。 数 据 源 类 型 包括 
以 下 儿 种 : 

€ Cognos Report: 使 用 Cognos 报表 作为 数据 源 。 

€ Cognos Package: 使 用 Cognos 包 作 为 数据 源 。 

€ Impromptu Query Definition (.iqd XF): 使 用 .iqd 文件 作为 数据 源 。 

€ Delimited-field text: 以 ASCII 文本 文件 作为 每 条 记录 的 输入 。 

€ Access table: 使 用 微软 的 Access 表 作 为 数据 源 。 

@ Access query: 使 用 微软 的 Access 的 .mdb 文件 作为 数据 源 。 

€ Excelcrosstab: 使 用 微软 的 Excel 的 crosstab 文件 作为 数据 源 。 
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€ Excel database: 使 用 微软 的 Excel 数据 库 作 为 数 





据 源 。 LEHI] Sales 
€ PowerHouse portable subfile: 使 用 Cognos 的 | 产品 名 称 


PowerHouse 子 文 件 作 为 数据 源 。 

€ Fixed-field text: LÀ ASCI 文本 文件 作为 每 条 记录 
的 输入 ， 每 行 结尾 以 text 行 分 隔 符 作为 标识 。 

© Fixed field and record without CR LF: 以 ASCII XC 





本 文件 作为 每 条 记录 的 输入 ， 每 行 结尾 没有 text 18 16-34. Cognos Transformer 数据 源 


Hr 


行 分 隔 符 。 


^H X Cognos Transformer 腔 单 的 介绍 见 表 16-12. 


数据 源 类 型 
Cognos Report 
Cognos Package 


Impromptu Query Definition 


Access table 


Access query 


Excel crosstab 


Excel database 


PowerHouse portable subfile 


Fixed-field text 


Fixed field and record without 


表 16-12 Cognos Transformer 菜单 
ji 述 

可 以 从 报表 中 导入 条 目 

可 以 从 多 维 模型 包 中 导入 条 目 

.iqd 文件 是 从 Cognos Series 7 Impromptu 和 Cognos 8 的 Framework Manager 框架 中 (如 外 
部 化 得 询 文件 ) 生成 的 

一 个 访问 表 ,, 输入 值 是 从 一 个 Microsoft Access 文件 得 到 的 .Transformer 采 用 微软 的 ActiveX 
数据 对 象 (ADO) 的 驱动 程序 来 访问 数据 

访问 查询 , 源 表 中 描述 的 一 个 Microsoft Access 查询 (.mdb 文件 )。Transformer 使 用 Microsoft 
ActiveX 数据 对 象 CADO) 的 驱动 程序 来 访问 数据 。 或 者 从 可 以 支持 ODBC 的 数据 库 服务 器 
中 的 源 列 运行 SQL 去 查询 .mdb 文件 

与 Excel 交叉 表 ， 输 入 值 是 从 一 个 Excel 交叉 表 文 件 得 到 的 

与 Excel 资料 库 ， 输 入 值 是 从 一 个 Microsoft Excel 电子 表格 数据 库 文 件 得 到 的 。 在 
Transformer 中 ， 从 表 或 区 域 中 的 选择 区 域名 称 

随 着 数据 仓库 便携 子 文件 ， 输 入 值 是 从 一 个 Cognos 公司 数据 仓库 便携 子 文件 得 到 的 。 特 
别 是 子 文件 的 便携 式 字 典 〈.psd) 的 文件 或 数据 Cps) 文件 。 接 受 默认 的 字符 集 或 指定 一 个 
替代 值 

采用 固定 字段 中 的 文本 ， 输 入 值 是 从 一 个 ASCII 文本 文件 得 到 的 。 每 个 字段 开始 于 紧 接 前 
场 字 节 ， 每 个 字段 的 宽度 占据 了 指定 的 字 节 数 。 每 一 行使 用 文本 行 结束 符 结束 

输入 值 是 从 一 个 ASCII 文本 文件 得 到 的 。 每 个 字段 开始 于 紧 接 前 场 字 节 ， 每 个 字段 的 宽度 
占据 了 指定 的 字 节 数 。 记 录 不 以 一 个 文本 行 分 隅 符 来 结束 























16.10.2 Dimension Map 
Dimension Map 是 维度 设计 的 窗口 ， 如 图 16-35 所 示 。 根 据 数 据 源 的 表 或 者 视图 信息 ， 








可 以 进行 业务 报表 维度 的 设计 工作 ， 包 括 维度 、 层 、 分 类 等 内 容 。 


lil Dimension 下 ap 





@ 统计 日 期 地 区 名 称 
[e [aem | uzam 


[ee 
NUN 
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图 16-35 Dimension Map 


16.10.3 Measures 





Measures 是 度量 窗口 ， 用 于 创建 度量 标准 ， 如 图 16-36 所 示 。 可 以 从 Data Sources 窗口 
中 直接 拖 动 列 到 该 窗口 进行 度量 的 目 动 创建 ， 也 可 以 在 该 窗口 中 蛙 击 限 标 右键 ， 在 弹出 的 快 
捷 亲 单 中 选择 Insert Measures 命令 来 日 定义 一 个 上 度量。 日 定义 的 度量 需要 在 “类 型 ”选项 卡 
中 指定 “ 列 ” 操 作 。 











16-36 Measures 窗口 


16.10.4 PowerCubes 


PowerCubes 是 立方 体 窗口 ， 如 网 16-37 所 示 。 维 度 和 上 度量 创建 完成 之 后 ， 束 可 以 使 用 
Transformer 的 自动 生成 立方 体 功能 留 来 创建 一 个 立方 体 多 维 模型 。 立 方 体 创 建 无 误 后 , 在 该 窗 
口中 用 鼠标 右键 单 击 立 方 体 名 ， 在 弹出 的 快捷 菜单 中 选择 Publish PowerCube as a Data Source 
and Package 命令 来 发 布 立 方 体 。 发布 成 功 的 立方 体 ， 在 Cognos Connection 中 可 以 使 用 Analysis 
Studio 来 进行 分 机 和 制作 多 维 报表 的 操作 。 


" PowerCubes mE 


— 


^ Sales 




















16-37 PowerCubes 窗口 


16.10.5 Customer Views 





Customer Views 是 目 定 义 容 户 视图 窗口 ， 如 图 16-38 所 示 。 
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uar 








图 16-38 自 定 义 客 户 视图 


16.10.6 Signon 


当 创 建立 方 体 的 时 候 ， 可 以 创建 一 个 Signon 以 便 Transformer 安全 访问 数据 产 。 
Transformer 包含 两 种 类 型 的 Signon。 
€ Data Source Signon: 可 以 从 .iqd 文件 导入 ， 当 Cognos 8 数据 源 定义 了 一 个 没有 密码 联 
系 的 内 容 管理 时 ， 同 样 也 可 以 在 Transformer 中 被 创建 。 
€ Cognos 8 Signon: 可 以 在 命名 空间 外 配置 用 户 映 份 验 证 。 





16.11 Cognos PowerPlay 


PowerPlay 是 数据 探 察 分 析 功 能 ， 如 图 16-39 所 示 。 





t PowerPlay — [PPlay2 of Sales3 (Explorer)] 
€ Kile Edit View Insert Explore Calculate Format Tools Window Help a x 


pelala] s. [ue na| sje [poo ejejejmm m m iE) [£d Ma a a| || | in 
v [ares euet sum ] eese J em] 


D: XBackup VCI] Y PATE ansfor 
+- DATES 
+- £ PRODUCT NAME 
+- £ REGION NAME 
* MEASURES 









RRRA 红木 家 有 具 地 中 海 家 具 现代 家 具 





图 16-39 Cognos PowerPlay 界面 
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16.11.1 菜单 介绍 


AX Cognos PowerPlay 3 [f] 4r 28 ILK 16-13. 


File 


Edit 


View 


表 16-13 Cognos PowerPlay 菜单 


New 

Open 

Close 

Close All 

Save 

Save As... 

Publish to Upfront... 
Publish as HTML... 
Duplicate As 

Page Setup 

Print Preview 

Print 

Deployment Options... 
Shared Dimensions 
Preferences 

Exit 

Undo 

Redo 

Copy 

Paste Special... 
Delete 

Find 

Select 

Rename Label 
Normal 

Page Layout 

Page Width 
ToolBars 
Dimension Viewer 
Dimension Line 
Title 

Status Bar 

Legend 

HighLight Subset 
Calculated Categories 


Explain 


说 
新 建 
打开 
关闭 
关闭 所 有 
保存 
男 存 为 
发 布 到 前 期 
当成 HTML 发 布 
复制 
页 面 设置 
打印 预览 
打印 
部 署 选 项 
共享 维度 
参数 
退出 
撤销 
重 做 
复制 
粘贴 
删除 
查找 


图 例 
高 党 显示 子 集 
计算 类 型 


解释 


明 
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菜单 Ty x Hn dio 明 
互 换 操作 ， 有 3 种 模式 ， 行列 互 换 、 行 层 互 换 和 列 层 互 换 
改变 报表 显示 模式 ， 包 插 交 又 列表 、 柱 形 图 、 侠 形 图 、 线 性 
图 等 
pO ee 排名 
Sort 排序 
xis 
显示 值 ， 有 7 种 方式 
ATER 
PEN 
A 
Ivi 
em 
DT 
nau 
Era 
Calculate 黑 计 百分比 到 
标题 、 页 头 、 页 尾 设置 
Format 
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菜单 说 明 
Tools 


16.11.2 ”工具 栏 


BU 


AR Cognos PowerPlay 工具 栏 的 介绍 见 表 16-14. 


表 16-14 Cognos PowerPlay 工具 栏 





NET 说 明 
重 设 维度 El 排序 
» " 
ZEE q> 在 Explorer 与 Reporter 模式 之 间 转 换 


显示 值 不 为 0 的 列 以 简单 的 柱 形 图 形式 展示 
显示 值 不 为 0 的 行 和 列 以 柱 形 图 集 形 式 展示 
l| 以 单条 线性 图 形式 展示 
wem | 


16.11.3 ”维度 视图 


Cognos PowerPlay f£ EE 44 ES] ILK 16-15. 





e |n [e le a 


表 16-15 Cognos PowerPlay 维度 视图 
iz w 明 fool ji 明 


= 替换 布局 fa 创建 find-in-cube 定义 


16.12 ”本 章 小 结 


1) ERE, HENA TS Cognos 的 历史 、 现 状 。 接 下 来 ， 又 分 别 介 绍 了 Cognos JF. TL 
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具 的 使 用 ， 比 如 Query Studio. Report Studio. Analysis Studio. Event Studio. Framework 
Manager. Transformer 等 工具 。 

2) Cognos 通过 报表 展示 的 数据 ， 是 基于 统一 的 元 数据 模型 。Cognos 强大 的 报表 制作 功 
能 可 以 制作 出 满足 任何 需求 的 报表 ， 其 基于 B/S 的 使 用 方式 在 提供 方便 的 同时 ， 还 将 部 著 成 
本 和 管理 成 本 降 到 最 低 。Cognos 还 可 以 同 数据 挖 握 工 具 及 统计 分 析 工 具 搭配 使 用 ， 以 增强 决 
策 分 析 的 功能 。 

3) Cognos 的 特点 : 方便 的 基于 B/S 架构 的 报表 开发 工具 ， 强 大 的 报表 制作 、 部 闭 、 发 
布 、 管 理 功 能 ， 快 速 的 数据 访问 、 分 析 能 力 ， 强 大 的 安全 性 保障 ， 更 多 的 用 户 和 群体 。 

4) Cognos Connection 是 Cognos 集 设 计 和 管理 于 一 体 的 报表 工具 。 

Cognos 安装 成 功 以 后 ， 用 户 丈 可 以 登录 到 Cognos Connection 界面 进行 报表 的 开发 和 管 
B 

5) 用 户 使 用 Query Studio 可 以 自 定 义 生 成 一 些 简 单 的 报表 。 在 用 Framework Manager 发 
布 元 数据 模型 之 后 ，Query Studio 就 可 以 使 用 访 元 数据 进行 一 些 徐 单 的 运算 ， 以 实现 动态 的 业 

6) Report Studio 是 为 用 户 设 计 开 发 复杂 报表 的 专业 开发 工具 。 其 编辑 和 展示 功能 要 比 
Query Studio 强大 得 多 。 

7) Analysis Studio 可 以 开发 比较 复杂 的 报表 。 其 分 析 功 能 要 强 于 Report Studio， 但 是 样 
式微 欠缺 。 用 户 在 使 用 Analysis Studio 的 过 程 中 ， 可 以 对 立方 体 模 型 中 的 数据 进行 切片 、 
钻 取 等 专业 操作 。 

8) Event Studio 可 以 对 事件 发 生 改变 的 条 件 以 及 事件 的 变化 结果 进行 相关 设置 。 比 如 ， 
TE RERU cS 0 点 时 分 发 送 一 封 邮件 ， 每 月 星期 一 早上 6 点 目 动 生成 一 份 报 表 等 。 

9) Framework Manager 是 元 数据 模型 的 制作 工具 。 在 制作 完 元 数据 模型 后 ，Framework 
Manager 还 将 这 些 模 型 发 布 到 Cognos 的 设计 环境 中 ， 这 样 Query Studio 和 Report Studio 才能 
IE? V VENDIT IG e 

100 用 户 通 过 Transformer 分 析 数 据 源 ， 然 后 建立 维度 和 度量 ， 最 后 生成 立方 体 模型 。 久 
方 体 模 型 是 OLAP 分 析 数 据 的 基础 。 

11) PowerPlay 用 于 制作 基于 立方 体 数 据 模 型 的 多 维 分 析 报 表 。 
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第 17 章 Informatica 的 安装 与 快速 入 门 


本 章 目标 

工具 篇 介绍 了 Informatica 软件 的 评 细 使 用 说 明 ， 本 章 将 接 看 工具 篇 继续 深入 讲解 
Informatica 的 安装 与 快速 开 友 。 其 中 Informatica 的 安装 分 服务 器 安装 和 客户 闹 安 装 两 部 分 。 
在 Informatica 快速 入 门 中 ， 本 章 将 以 一 个 实例 来 介绍 Informatica 的 开发 过 程 ， 使 用 户 在 学 习 
Informatica 的 功能 以 后 ， 能 快速 地 进行 企业 级 项 目的 开发 工作 。 

学 习 本 革 后 ， 您 将 掌握 : 

€ Informatica PowerCenter 的 服务 器 和 客户 端 安装 步骤 。 

@ Informatica PowerCenter 工具 的 使 用 流程 。 

@ Informatica PowerCenter 快速 入 门 。 














17.4 Informatica PowerCenter 的 安装 方案 





Informatica PowerCenter 安装 分 为 服务 器 闫 安装 和 客户 端 安装 。 初 次 接触 Informatica 
PowerCenter 的 用 户 不 妨 将 其 想象 为 Oracle 的 安装 ， 因 为 Oracle 的 安 闭 也 是 分 为 服务 器 端 和 
ZE Fm HJ o 


17.1.1 安装 前 的 准备 


在 安装 Informatica PowerCenter 前 需要 创建 一 系列 数据 库 执 行 脚本 ， 有 具体 如 下 : 
1. 创建 表 空 间 ， 用 于 存放 数据 库 的 数据 


CREATE TABLESPACE BI ETL DATAFILE 'D:\oracle\product\10.2.0\oradata\BI\ BI ETL.dbf 
SIZE 1000M REUSE AUTOEXTEND ON NEXT 100M; 


这 里 ， 你 存 位 置 、 空 间 大 小 需要 按照 实际 情况 灵活 改变 。 
2. 创建 域 用 尸 并 分 本 权限， 用 来 管理 域 


CREATE USER "BI DOMAIN" IDENTIFIED BY "BI DOMAIN" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 

GRANT "CONNECT" TO "BI DOMAIN"; 

GRANT "DBA" TO "BI DOMAIN"; 

GRANT "RESOURCE" TO "BI DOMAIN"; 
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GRANT UNLIMITED TABLESPACE TO "BI DOMAIN"; 
GRANT SELECT ANY TABLE TO "BI DOMAIN"; 
ALTER USER "BI DOMAIN" DEFAULT ROLE ALL; 


3. 创建 资源 库 用 尸 并 分 配 权 限 


CREATE USER "BI RESOURCE" IDENTIFIED BY "BI RESOURCE" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 

GRANT "CONNECT" TO "BI RESOURCE"; 

GRANT "DBA" TO "BI RESOURCE"; 

GRANT "RESOURCE" TO "BI RESOURCE"; 

GRANT UNLIMITED TABLESPACE TO "BI RESOURCE"; 

GRANT SELECT ANY TABLE TO "BI RESOURCE"; 

GRANT CREATE ANY VIEW TO "BI RESOURCE"; 

ALTER USER "BI RESOURCE" DEFAULT ROLE ALL; 


4. 创建 数据 分 析 用 户 并 分 配 权 限 


CREATE USER "BI DATAANALYZER" IDENTIFIED BY "BI DATAANALYZER" DEFAULT 
TABLESPACE "BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT 
UNLOCK; 

GRANT "CONNECT" TO "BI DATAANALYZER"; 

GRANT "DBA" TO "BI DATAANALYZER'"; 

GRANT "RESOURCE" TO "BI DATAANALYZER'"; 

GRANT UNLIMITED TABLESPACE TO "BI DATAANALYZER"; 

GRANT SELECT ANY TABLE TO "BI DATAANALYZER'"; 

GRANT CREATE ANY VIEW TO "BI DATAANALYZER"; 

ALTER USER "BI DATAANALYZER" DEFAULT ROLE ALL; 


5. 创建 元 数据 用 尸 并 分 配 权限 


CREATE USER "BI METADATA" IDENTIFIED BY "BI METADATA" DEFAULT TABLESPACE 
"BI ETL" TEMPORARY TABLESPACE "TEMP" PROFILE DEFAULT ACCOUNT UNLOCK; 
GRANT "CONNECT" TO "BI METADATA"; 

GRANT "DBA" TO "BI METADATA"; 

GRANT "RESOURCE" TO "BI METADATA"; 

GRANT UNLIMITED TABLESPACE TO "BI METADATA"; 

GRANT SELECT ANY TABLE TO "BI METADATA"; 

GRANT CREATE ANY VIEW TO "BI METADATA"; 

ALTER USER "BI METADATA" DEFAULT ROLE ALL; 


17.1.2. ”服务 器 端 安装 


在 做 完 准备 工作 之 后 ， 开 始 安 装 Informatica PowerCenter 服务 器 。 首 先进 入 Informatica 

PowerCenter 的 安装 有 目录， 双击 “install.exe” 和 安装 文件 ， 弹 出 安装 界面 ， 如 图 17-1 所 示 。 
选择 Server 选项 ， 系 统 开始 Informatica PowerCenter 服务 器 问 的 安 逆 ， 如 几 17-2 所 示 。 
随后 进入 Informatica PowerCenter 服务 器 的 安装 欢迎 界面 ， 如 图 17-3 所 示 。 
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Fə Informatica PowerCenter 8.1.1 


















17-1 





Installånywhere 


Installànywhere 正在 做 安装 准备 … 
正在 解 讨 缩 .. 


?2002-2005 Macrovision Europe Ltd. and/or Macrovision Corporation 





INFORMATICA* 


PowerCenter?^ 8.1.1 


Please select an option to install 


© Server 
© Client 
© Reports 


Hote: Before you continue, please read the 
PowerCenter Installation and Configuration Guide 
and Release Notes located in the root directory 
of the PowerCenter Documentation CD and in the 
Documentation Center at http://my. informatica. com. 






Browse DVD -> 


INFORMATICA 


Informatica PowerCenter 的 安装 界面 





取消 


17-2 Informatica PowerCenter 的 准备 安装 界面 


INFORMATICA 


È Installation Preraguisiias 
@ Installation Sat 

© DA 6. ifii License ray 
© IÓistallatian Directory 

© ^oplicaion Server Conn 


© Pre-lnstallaiian Surra 
© ivrsialiny,. 

® Torrain Gorifguration 

Q node Confguration 

Q nuinenticadan 

© Repository Conf gratior 
© Postinstallaton Surnrtary 


Prare hy Macrovision 





Informatica PowerCenter 8.1.1 


Welcome 


Welcome to Informatica PowerCenter 8.1.1. You can use this wizard 
to install PowerCenter 8.1.1. 


Copyright © 1999-2006 Informatica Corporation. AIl rights reserved. 
This wizard guides you through installation of Informatica 


PowerCenter 8.1.1. Click Next to start the installation. Click Cancel at 
any time to stop the installation and exit the wizard. 


This Software is protected by U.S. Patent Numbers 6,208,990; 


Previous 


17-3 Informatica PowerCenter 服务 器 的 安装 欢迎 界面 
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选择 正确 的 License Key 文件 ， 如 图 17-4 所 示 。 









LB Informatica FowerCenter $8.1.1 ug ES 
INFORMATICA PowerCenter License Key 


F 
F 
e Select the license key file: 


(9 Inztallatian mPrerequisitez | C Documents and SettinasV&dministratorlicense. key 
Ð riallaiior Sai 一 一 一 | 


È De 2 mil Licarse Fay 


® Insialatiorn Diraciory 








49 ^nplicatian Sarvar Cur q^ 
È -Pre-Insiallatinn Siurrimary | 
3 risialliny... p 

(9 Dorai- Gorig EN ri 

È rode confguration 
CEEE 

$ Fepositor Goniidguraiion 


(9 Pozstlnstallatiar Surrrrar, 





[Psta LEE ERO IET ER CR Marroi DIT 


NEN 





[Pes Jm 





17-4 PowerCenter License Key 文件 选择 癌 导 


Informatica PowerCenter IKI tr] ARARE RK T n 17-5 所 示 。 


LR Informatica PowerCenter $8.1.1 


INFORMATICA 


Installation Prerequisites 


Fowerċenter Repository Database: Oracle, DBZ, SAL Server 
E mvindows anly), Sybase 
(9 Inziallatiorn Sai | Data Analyzer Repository Database: Oracle, DBZ, SQL Server, 


(Q9 Du & i Licenza rey Sse 

| i Metadata Manager Repository Database: Oracle, DB2, SL 
Q9 Inziallatian Directory p Server, Sybase 

Q9 pplication Server Cant ^| Domain Configuration Database: Oracle, DB2, SGL Server, 


i F'ra-Irisitallaiiori Serry Sybase 

© listalig... p- Atleastthree database user accounts are required to complete 
(Q9 Durrrain-confgturatinn the installation. 

È Hode confiquratiarn 

® Auinentication Disk Space Requirements 

Ð Raəposiiory Canfiguratiari 


PONE STE S FEST EST EST DITS T IT EST 


ls lbh ee bey Macros iir 


EH re 


17-5 Informatica PowerCenter 服务 器 的 安装 设备 及 软件 要 求 同 导 
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在 Informatica PowerCenter 服务 器 安装 过 程 中 ， 需 要 提前 创建 以 下 4 个 数据 库 。 

e 资源 库 : 存储 所 有 的 元 数据 信息 。 

e 数据 分 析 库 : 存储 在 数据 分 析 过 程 中 产生 的 数据 参数 指标 。 

@ 元 数据 管理 库 : 在 设计 过 程 中 产生 的 一 系列 数据 及 参数 指标 均 保 存在 该 数据 库 中 。 
e 域 配置 数据 库 ， 行 储 域 配置 过 程 中 的 参数 指标 。 

Informatica PowerCenter 服务 器 安装 模式 问 导 如 图 17-6 PR. 





| 


INFORMATICA Installation Set 


O Complete 


Includes the following components: 

* PowerCenter Services 

* PowerCenter Data Analyzer (dashboards, reports, and graphs) 
D^ & iil License Kay ' PowerCenter Metadata Manager 
TELS LETTER Diraciory 
Application Server conii... 
Pra-Insiallation Surnay 
EEIN Pp. 
Darrai Configuration ($ Custom 
Node ron Choose the PowerCenter components to install. 


RHET RET EDIT 


r:enositorg Confiquratiari 


OOOO0O000O0O0O0O0CCG 


r'asi-Inztallatiar Surrirriar; 


Installsnsvnere me Wacrovision 


[ coe ror 


17-6 Informatica PowerCenter 服务 器 安装 模式 向 导 





建议 初学 者 和 初级 开发 人 员 全 部 选择 安装 ， 这 样 可 以 全 面 地 了 解 Informatica PowerCenter 
服务 器 的 工具 ， 如 图 17-7 所 示 。 


LR Informatica PowerCenter $8.1.1 


INFORMATICA A, dvan ced Edition Components 


Select the PowerCenter components to install: 


PowerCenter Services 
PowerCenter Data Analyzer 
FowerCenter Metadata Manager 


Ò DA sl License Hey 
Ð Installation Directory 
W Application Sarvar Coni 
| "Pre-Insiallation Surfmany 
È Installing... E 
E Drain anfiguratiar 
lode Gormidguraiiarn 
LP MESURE EST RT STI [UT 
rianasin Coarniuratiur 


rüosi-Installaitiear Surrirriry 


Ins E lr ee Be Nacrovision 
li pg. | 





ewe J e 


17-7 Informatica PowerCenter 服务 器 组 件 向 导 
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选择 Data Analyzer/Metadata Manager License Key (数据 分 析 器 和 元 数据 管理 器 的 License 
Key 文件 )， 如 图 17-8 所 示 。 


LE Informatica PowerCenter 8.1.1 


INFORMATICA etadata Manager License Key 


Select the license key file for Data Analyzeriltetadata Manager 


C Dacuments and Settingsvsdministratorias license. xml 


Irrstallatierr Erirecrary 
H spplicatior Servar Co 
Pra-lasiallatior Surrirriziry 
$ Installing... E 
(B Dirai Ganüguraüan 
QB ode Conāguratiuri 
È suihernticatior 
BB Farposiior Songuraiion 


(Posilrisiallaiior Surrirriary 





Raae pie flai EE EST loan 


(cance LUNES 





17-8 DA&MM License Key 文件 向 导 


Bi PORKXAGR CES. DEOR, Un 17-9 所 示 。 
LB Informaatica PowerCenter $8.1.1 


INFORMATICA Installation Directory 


Choose the installation directory: 


Dr'InformaticaPowerrentera.1 .1 


È Pre-Insiallatian Serri E 
È Installing... — P 
© Li'arrrain- can 加 下 iion 

È rode Conüguration 

(9 nuitienticatian 


(9 Penuzitorr oniüguratian 


(9 Posi-lnztallatior EST TE EST 


less enses here Pre Macro sion 


ECCE NEIN M emos | 








17-9 Informatica PowerCenter 服务 器 安装 日 录 问 导 
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为 数据 分 析 器 和 元 数据 管理 器 选择 Application Server 〈 应 用 程序 服务 器 ) 中 间 件 ， 
Informatica 默认 集成 了 JBoss Application Server， 如 图 17-10 所 示 。 


X! Informatica PowerCenter 8.1.1 


INFORMATICA 


Application Server 


Choose the application server y au want to use with Data 
Analyzer or Metadata Manager. The installation program 
installs JBoss Application Server version 4.0.3 by default. If 
vou want to use WebLogic Server or WebSphere Application 
Server, you must install the application server before you 
install PowerCenter. 


d poo: ($) JBoss Application Server 
(9 -Pre-Installatian siurrirmiary 


® Installing... p 


È Durrain confiquratian 


C5 BEA WebLogic Server 

C IBM WebSphere Application Server (Network Deployment) 
(9 Hode Conñguratiuri 
FOXMESTE EST DRESD DET 


{DB Ranosiiory Soniyuraiior 


O IBM WebSphere Application Server (Base) 


(9 Puzi-Installatiari Surnriary 


IPs bal ar bre arrows iir 站 


Le 有 hee ONIS NEC 
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选择 默认 应 用 服务 器 ， 单 击 Next 按钮 ， 进 入 下 一 流程 ， 如 图 17-11 所 示 。 
‘u Informatica PowerCenter 8.1.1 


INFORMATICA Application Server Directory 


Data Analyzeril! etad ata Manager Configuration 
®© Install new JBoss Application Server 


O Use existing JBoss Application Server 


Choose the JBoss home directory: 
JBoss home: Dr NnformaticaPoweerCe 


Lu = 
A s | | 
DUO un " 


(9 -Pre-Inziallatian Surrimary 


È Installing... p 
i Dürrrain- Con figciratio ri 

È nada Conñguratiuri 

O i 

È Peapositor Gorigurailon 


(9 PaosrInsitallatior Surnriary 


les ta lb rere Pr Macross iar 


KCN Hee 


17-11 


Choose the JBoss Application Server configuration directory: 


vert entera. 1. 1WBpassaátrserverntormatica 


TOT—tmá 


configuration folder: 


Browse... 





| | 1 


Informatica PowerCenter 服务 器 安装 问 导 
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系统 提示 创建 一 个 新 的 JBoss 应 用 服务 还 是 使 用 已 有 的 应 用 服务 ， 然 后 需要 给 出 JBoss 
的 安装 目录 和 JBoss 应 用 服务 的 配置 目录 。 选 择 完 之 后 单 击 Next 按钮 ， 进 入 下 一 流程 ， 如 图 
17-12 所 示 。 
i Informatica PowerCenter 83.1.1 
INFORMATICA 
k E Review the following information before continuing. 


Product Hame : 
Informatica PowerCenter 8.1.1 


Selected Components : 
PowerCenter Services 
PowerCenter Data Analyzer 
Powercenter Metadata Manager 


Installation Directory : 
Di MnfarmaticasPowerCentera.1.1 


"T Irisi aliia F 
e Darr air carne aor 
oda Goniiyuraiion Chosen Application Server : 
® suinenticatian JBoss Application Server 


riens TITO J vorir arie 
e JBoss Home Directory 





FOND reste E EH DET Surrirriary 


Ins :tal ere Pr CLE DR E E Ed DI 





Previaus Install 


17-12 Informatica PowerCenter 服务 器 安装 预览 界面 





在 安装 预览 界面 ， 显 示 出 前 面 所 做 的 配置 信息 ， 如 果 需 要 修改 请 单 击 Previous 按钮 返回 
前 面 界面 进行 修改 ， 确 认 无 误 后 ， 单 击 Next 按钮 开始 安装 Informatica PowerCenter 服务 器 。 
该 过 程 可 能 需要 几 分 钟 ， 请 读者 耐心 等 等 ， 如 图 17-13 所 示 。 


LEM Informatica PowerCenter $8.1.1 







TFT Installing PowerCenter 8.1.1 


Informatica® PowerCenter* 


Single, Unified Data Integration Platf 





(9 Bb arreir- Serriid [两 各 ri 

QB Hode Gormduraiion 

(9 auitrariicaiion 

È Repository Soniyuraiion 

De 天 stalling... Java Runtime Environment 





Bilker he EC POP ir 


| Cancel 
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安装 完成 之 后 ， 系 统 提示 需要 创建 一 个 新 域 或 者 选择 连接 一 个 已 经 存在 的 域 ， 因 为 是 首 
次 安 狼 ， 所 以 选择 创建 一 个 狐 域 ， 如 图 17-14 所 示 。 


LE Informatica PowerCenter 8.1.1 


INFORMATICA Create or Join Domain 


一 一 一 


®© Create New Domain 


If vau are installing PawerCenter Services for the first time or you 
wantto create a new domain. 


O Join Existing Domain 


If vau are installing Fowercenter an multiple machines and vau 
have already created a domain an another machina. 


Help Me Select 


Qe ode Gormiauraiion Reminder. PowerCenter is licensed an a CPU basis. Consult your 


ER ust c AM lirensinn anreermant fnr details nn wnur licensed rnntfinuratinn 
LEUR EET RESTER E T 


rüusi-Installatioar surrnrrzry 


hatalara By Matriisi 


NN XN 


17-14 Informatica PowerCenter Jl 25-23 HJER te 285 [8] F 
接 下 来 需要 输入 连接 数据 库 服务 占 的 配置 信息 ， 用 来 保存 PowerCenter 域 配置 元 数据 ， 
如 图 17-15 所 示 。 


Y Informatica PowerCenter 8.1.1 


INFORMATICA 











PowerCenter Services Configuration 


Enter the user account information far the database to store 
PowerCenter domain configuration metadata. You can stare the 
PowerCenter domain configuration metadata and a Powercenter 
repository in the same database user account. You must stare 
configuration metadata for different domains in separate database 


Database type: Oracle 
Database URL: 


Database user ID: 


(9 node confguratian Database user password: 


dB utteriicsiion Database service name: 
© Ranosiiory Sonyuraion 


È PusiInziallation Surri 


TUESLES LES TEE ere me aat ub 


mee O e 


17-15 Informatica PowerCenter 服务 器 的 域 数 据 库 配 置 癌 导 
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然后 需要 输入 PowerCenter Services 配置 参数 ， 如 图 17-16 所 示 。 


LE Informatica FowerCenter PB 1 


INFORMATICA 














PowerCenter Services Configuration 
Enter the information far the PowerCenter domain you want to 


peanta 


(9 node configuration 


W uirrariicaiior l " 
m E F Mote: A Repository Service is required far a Metadata Manager 
O Reposiior Conñguratior | 
installation and is created by default. 


QB Posilrsiallaiiorn Surri | Advanced Configuration | 


[rs tale er Beg la roilsion 


ne A ee 
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在 输入 信息 并 确认 无 误 后 ， 单 击 Next 按钮 开始 安装 Informatica PowerCenter 服务 器 。 该 
过 程 可 能 需要 几 分 钟 ， 请 读者 耐心 等 待 ， 如 图 17-17 所 示 。 


ne JL rer 





l Informatica PowerCenter 8.1.1 


INFORMATICA | Analyzing System 


The installatian program is analyzing the system. This may take a few 
moments. 


(9 rode Conñguratiari 
dB ruinerntigatior 
(Baposiiory Gormyuraiion 


(9 Posilrsiallaiior Surnrary 


TUESLE LE EE er Pe CLE DC EY E DT I 


17-17 Informatica PowerCenter 服务 器 开始 安装 


随后 Informatica 为 服务 选择 一 个 计算 机 账号 进行 登录 ， 如 果 不 选择 该 项 ，Informatica 的 
服务 log 将 创建 在 本 机 系统 当前 账号 下 ， 如 图 17-18 所 示 。 
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Y Informatica PowerCenter 8.1.1 


gure Informatica Services 


Povrercenter Services Configuration 


Enter the user name and password that the Informatica Services 
service uses to lag an ta the machina. Ifvau do nat selectthis 
option, the Informatica Services service logs an with the Local 
System account he user account currently logged in the machine. 


Selectthis option if vau want Informatica Services to run under a 


= 


[| |Install Informatica Services with a different user account 


Non Leer name: VW CFB3SBDSSSECVdministrator 
$ Hode E ERE TESTER Password : [uy 


LEOTE TREES DS L6 DT 


)60660666666060€ 


È Reposiiorn Coniguratiori 


(9 Puzrtlnztallation Surrirriary 





maare By larai dom 





17-18 Informatica PowerCenter 服务 配置 问 导 


该 过 程 可 能 需要 儿 分 钟 ， 请 读者 耐心 等 每 ， 如 图 17-19 所 示 。 
Y Informatica PowerCenter 8.1.1 


INFORMATICA Analyzing System 


一 一 


The installation program is analyzing the system. This may take a few 
moments. 


È Hode Goniiguraiion 


© sumenicatiur 


È Reposiior Conñguratiori 


POM Posilrsiallaiior Surrirriary 


TUESLE LE EE ESTEE OE OE DC DE E] D 


Cancel Help i Previaus 





17-19 Informatica PowerCenter HR 45-22 [u] 55 
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接 看 需要 为 PowerCenter 元 数据 知识 库 配 置 Repository 资源 ， 如 图 17-20 Hrzn -o 


LE Informatica FowerCenter EPI 


INFORMATICA Center Repository Configuration 


Powrercenter Repository for Metadata Manager 
© Create new PowerCenter repository 


O Use existing PowerCenter repository content 


Repository name: 
Code page: MS Windows Simplified Chinese, supers... ba 
Database type: 


Database userID: 
Database user password: 


Connect string: 


Reminder. PawerCenter metadata repositories are licensed an an 


in + 二 Fr hacic 
[HUI | Test Connection 


Q9 Puztlnztallation Surnrnary 


TOES EST LETS ESTEE IUE ES DR UE E DI E 


ECCE NLCNM 
17-20 PowerCenter 元 数据 知识 库 配 置 回 导 


该 过 程 可 能 需要 几 分 钟 ， 请 谈 者 耐心 等 待 ， 如 网 17-21 Przn. 





V. Informatica PowerCenter 8.1.1 


INFORMATICA | Analyzing System 


—* 


The installation program is analyzing the system. This may take a few 
moments. 


LEO REESE ERES DTE 


OCC ayy 


Faposliory Conigurztior 


(9 Puztlnztallatior Surrirriary 





Ins eeeTR pe by E COS 9999 ———————— ii 


17-21 PowerCenter 元 数据 知识 库 安 装 问 导 
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接 下 来 需要 创建 PowerCenter 集成 服务 ， 并 选择 编码 格式 ， 如 图 17-22 所 示 。 


HD Informatica PowerCenter 8B.1.1 


INFORMATICA | nfigure Integration Service 


—— — ——— 


Powertcenter Services Configuration 


Enter the name and data movement mode for the Integration 
Scenice. 


Create Integration Service 


Semice name : Powvercenter Integration: Service 
USer name: Administrator 


Fasswurd : EEE TE TE E E TE TE E E TE i 
selectthe character data moverent made: 


(C) ASCII 
® iteriicaiion ($5 Unicode 


®© Repository Goniyuraiion Mote: Integration Service is required for Metadata Manager 
(9 PastInztallatior Surrnrriary installation and is created by default. 


[Ps ta rer br CEST EI E DT 


[ cou ven No 


17-22 PowerCenter 集成 服务 配置 问 导 


汉 接 看 ， 系 统 提示 需要 创建 一 个 新 的 数据 分 析 需 资源 或 者 选择 使 用 已 经 存在 的 数据 分 析 
需 资 源 环 境 。 选 择 创建 一 个 新 的 数据 分 析 需 资源 ， 如 图 17-23 所 示 。 
Y Informatica PowerCenter $8.1.1 


INFORMATICA 





e Create neve Data Analyzer repository 


Q Use existing Data Analyzer repository content 


Database type: 


Databaze URL: 


Databaze user ID: 


—— 


Database user password: 


F 
kn 
r 
e 
us 
F 
F 
wf 
F 
b 
© 


rüazi-Inztrallatiar Suri 


Insialre are Bey Macis C] 


[ Cae | 





17-23 PowerCenter 数据 分 析 器 配置 癌 导 
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最 后 ， 系 统 提示 需要 创建 一 个 新 的 元 数据 管理 喜 资 源 或 者 使 用 已 经 存在 的 元 数据 管理 吉 
环境 。 选 择 创建 一 个 新 的 元 数据 管理 局 资 源 ， 如 网 17-24 所 示 。 


V) Informatica PowerCenter 8.1.1 [- | Ed 


INFORMATICA 


— — áÀ S 








er Repository Configuration 









(e Create new Metadata Manager repository 


Q Use existing Metadata Manager repository content 


Database URL: localhast:1521;SIDzarcl 


Database user ID: Bl METADAT.A 


OQ GG ees e CR 


Q Posilrisiallaiior Surrirriary | Test Connection | 


less ereestiere 3 


17-24 PowerCenter 元 数据 管理 器 配置 癌 导 


该 过 程 可 能 需要 儿 分 钟 ， 请 读者 耐心 等 每 ， 如 图 17-25 所 示 。 
Tl Informatica PowerCenter $8.1.1 


INFORMATICA Analyzing System 


The installation program is analyzing the system. This may take a few 
marnments. 


La 
vul 
* 
d 
. 
Lo] 
Um 
Ner 
Nu 
v 
s; 
el 
s 
M 


B ruszi-Installatiar zurrrriar 


[Pvta lb ee ORE laiis iar 到 


NN | 


17-25 PowerCenter 元 数据 管理 器 安装 癌 导 
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最 后 ， 出 现 如 图 17-26 所 示 的 界面 ， 说 明 Informatica PowerCenter 服务 端 已 经 安装 成 功 。 
该 界面 显示 了 安装 服务 的 综合 信息 。 





LR Informatica FowerCenter 8.1.1 


INFORMATICA 


Installation Status : SUCCESS 


Installation Status : SUCCESS 

The PowerCenter 8.1.1 installation completed 
successfully. The information below summarizes the 
location and configuration af the installed products and 
components and status of the services. Use the debug 
lag file 

D Anfarmatica/PawerCentera.1.1/Informatica Installatian 
server Debug.lag far mare information. 


Installation Date : 
Thu May 31 08:17:11 CST 2007 


Product Name : 


TOES LEE rte br LES DRE EE E] DT 


17-26 PowerCenter 服务 端 安装 完成 界面 


单 击 Done 按钮 完成 安装 。 
登录 http://localhost:6001/adminconsole/Login.do， 如 图 17-27 所 示 。 











^" Informatica PowerCenter Administration Console — Windows Internet Explorer 
THE Sm SEO RRA ITA 8EBDOD 
-JS v |Æ http://localhost: 6001 adminconsole/Login. do 


7m » 


X od | Informatica PowerCenter Administration Co... m- B dh 7 innt 7 CIBO :- 














Help About 


Informatica PowerCenter Administration Console 











Password: | 





CITECEN Y 


PowerCenter Administration Console 





F &» Internet 


17-27 Informatica PowerCenter 服务 端 登 录 测 试 界 面 


LJ admin/admin 登录 后 ， 进 入 Informatica PowerCenter 服务 器 管理 员 探 制 台 界面 ， 如 
图 17-28 所 示 。 
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Informatica PowerCenter Administration Console — Windows Internet Explorer 


TFE 编辑 区) EVU REXA IA  $B500 








-JS v n http: //localhost:B001/adminconsole/Domains. do 


me 








vit X | 百度 














w dir Æ Informatica PowerCenter Administration Co... | 


m) 





e- w -:óANBDO-OIRO-" 





Informatica PowerCenter Administration Console 


| Domain EE 


Administration 


x B Details for domain: Informatica Domain 


2nd: | Do 


is Localhost NodeO1 





se PowerCenter Integration Service 
Eg PowerCenter 
Q License WWW-CF63B08936C 8356 


Administrator Help About Logout 


Upgrade Manage Account 


Legend 


| [overview Log Management 


Last updated: #0 z E 31 09:20:55 2007 











| Eg PowerCenter 


| $8 PowerCenter I... 





€i Localhost Node01 


v 








G 
v 











[® &? Internet 


17-28 Informatica PowerCenter 服务 器 管理 员 控 制 台 界面 





在 域 控制 台 ， 可 以 对 域 对 象 进行 管理 ， 例 如 服务 (Services)、 节 点 (Nodes)、 序 列 号 


(Licenses) 和 网 格 (Grids)。 


17.1.3 ”客户 端 安装 


17.1.2 WH f Informatica PowerCenter 服务 器 的 安装 ， 本 节 将 介绍 Informatica 
PowerCenter 客户 端的 安装 。 首 先进 入 Informatica PowerCenter 的 目录 ， 双 击 “installexe” 安 


TOUT, SPHERE. lE 17-29 所 示 。 


F Informatica PowerCenter 8.1.1 





INFORMATICA*9 


PowerCenter? 8.1.1 


Please select an option to install 


© Server 
© Client 
© Reports 


Note: Before you continue, please read the 
PowerCenter Installation and Configuration Guide 
and Release Notes located in the root directory 
(of the PowerCenter Documentation CD and in the 
Documentation Center at http://my. informatica. com. 


Browse DVD -> 


17-29 PowerCenter 安装 界面 
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在 该 界面 中 ， 和 选择 Client 选项 ， 系 统 将 开始 Informatica PowerCenter 客户 端的 安装 ， 如 
图 17-30 所 示 。 





InstallAÀnywhere 


Installánpwhere 正在 做 安装 准备 .. 


17-30 Informatica PowerCenter 的 准备 安装 界面 


随后 进入 Informatica PowerCenter 客户 端的 安装 欢迎 界面 ， 如 图 17-31 所 示 。 
1! Informatica PowerCenter Client 8.1.1 


INFORMATICA 


Welcome Welcome to Informatica PowerCenter Client 8.1.1. You can use this 
® NRN Preces wizard ta install Powercenter Client 8.1.1. 

r^ TESTEN Sal E 
È Instellatian Dirscrary 

| LO metadata Marsga dl jari 


Copyright & 1999-2006 Informatica Corporation. All rights reserved. 


D NN co C CS QNNM This wizard guides vau through installation af Informatica 
© gem M PowerCenter Client 8.1.1. Click Net to start the installation. Click 
(9 Installirg... P Cancel at any time to stop the installation and exit the wizard. 


(9 Posrinztallatiorstrrnrun 


This Sofware is protected by LI. 5. Patent Numbers 5,208,890; 


[ x d "T E] wx : boa " aer | | 
Installernssnere his ellan i [1 


en 


17-31 Informatica PowerCenter 客户 端的 安装 欢迎 界面 









































接 下 来 进入 Informatica PowerCenter 客户 端 安装 的 系统 配置 要 求 界 面 : PowerCenter 客户 
兽 需 要 至 少 125MB 的 磁盘 空间 、 元 数据 管理 器 客户 端 需要 710MB 的 人 磁极 空间 ， 那 么 完成 客 
户 端 的 安装 就 需要 至 少 835MB 的 磁盘 空间 ， 如 图 17-32 所 示 。 








203 


4! Informatica PowerCenter 


INFORMATICA 


® msiallatiurn sa 

È Installation Directary 

®© vatadata Maraga iar 
(9 Pre-Insiallatior Surri 
CB msiallinyg.. A 


Th. (m TA a BA [ENE Er EAN U eT e re P i 
Qu Psst 


matalana br i ES EM CR EI ES DET 


Client 8.1.1 


Installation Prerequisites 


Visio suppart: Micrasaft. NET Framework 1.1 or later must ha 
installed an the system. 


Disk Space Requirements — PowerCenter Client: 125 MB 
Metadata Manager Client: 710 MB 
Complete installation : 835 MB 








17-32 Informatica PowerCenter X F imn ZH HJ zs B SK EB 














*! Informatica PowerCenter Client 8.1.1 


INFORMATICA 


© 

© Installation Direchany 

È metadata tarayan liari 
© Pre-Installatiar Summa | 
BC Insitelliri... pd 


LONE Eten EDT Errar 
| - , 


TOSS LIE ECHTE br LESER ES ES DET 


© Complete 


Install Powercenter Client, Metadata Manager Client 
(Metadata Manager Console and Custom Metadata 
Configuratary, and ODBC drivers. 


(9 Custom 


Choose the Powercenter components to install. 





17-33 PowerCenter 安装 模式 界面 
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Be PREKRITA (APER, EBDEOCEORPABRLOROIIO, GRBPEBGEOUGERIA 


如 图 17-33 所 示 。 


然后 选择 要 安 疤 的 组 件 ， 建 议 初 学 者 部 选择 ， 如 图 17-34 所 示 。 


| 


INFORMATICA 


Select the components to install: 


F] PowerCenter Client 
Metadata Manager Client 


e Insiallatior Drireetany | 
© natidata narrar Sliert | 
@ Pre-Installation Surnimaig ) 
I restes ri Si 


| ES Eten EHE ETTEETET 





图 17-34 PowerCenter 安装 组 件 向 导 





系统 显示 Informatica PowerCenter 客户 端的 安装 路 径 ， 如 图 17-35 所 示 。 


* Informatica PowerCenter Client 8.1.1 
INFORMATICA 


Chnose the installation directory : 


D: unformaticaPowverCentera.1 .1 


_ Restore Default —. Browse... 


Matadata BD ESTTESTAEST ROS [EST 
© Pre-Installation Surriramy. 
BB mialliny... P 


(9 PusrInstallatan-Sürniarg 


Installers mre macros spon 








17-35 PowerCenter Z3 H 5x [n] 5 


265 


为 Metadata Manager 输入 集成 资源 库 的 名 称 以 及 Code Page 的 配置 参数 ， 如 图 17-36 
所 示 。 


«| Informatica PowerCenter Client 8.1.1 


INFORMATICA BER oce Client Configuration 


Enter the name ofthe PowercCenter repository and coda page for 
Metadata Manager. The PowerCenter repository name and cade 
page are required by the Custom Metadata Configurator. 


G rre-Insiallaien Surrey Integration Repository Name; PowerCenter | 
"ru 


€ nstalliny.. | prd Code Fage: MS Windows Simplified Chinese, super... se 
© Posr-InstallatioreSürfirriarg 


Hēnare pe LES LER Ed DELE 





17-36 PowerCenter 元 数据 管理 器 配置 癌 导 


BOB a sm. Uk 17-37 所 示 。 


w Informatica PowerCenter Client 8.1.1 
INFORMATICA 
felcami Review the following information before continuing. 


Product Name: 
PowerCenter Client 8.1.1 


Selected Components: 
Powercenter Client 

| lation Sur Metadata Manager Client 
LM "d | 
Installation Directory: 

Di nfarmaticasPawerCentera.1.1 


| P'oer-Instaltatoro Siri 


Shortcut Folder: 
start » Programs > Informatica Powercenter 8.1.1 > 
Client 

Disk Space Information: 


los ES reperire by mat rw slim 


17-37 PowerCenter 安 关 设备 及 软件 要 求 问 导 
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如 果 以 上 安装 配置 信息 需要 改动 ， 可 单 击 Previous 按钮 返回 前 面 界 面 进行 修改 。 
有 问题 ， 则 单 击 Install 按钮 开始 安装 ， 如 图 17-38 所 示 。 


Wl Informatica FowerCenter Client 8.1.1 


INFORMATICA | Installing PowerCenter Client 8.1.1 


Informatica? PowerCenter? 


J =|| Singe, Unified Data Integration Platform 


Installing... Java Runtime Environment 


Irstelbsgnigestiere by barris imr 


17-38 PowerCenter 开始 安装 


"ORA a. RAK SPUR kR WME 17-39 所 示 。 
*! Informatica PowerCenter Client 8.1.1 


INFORMATICA. erCent t 8.1.1 Installation Summary 


Installation Status: WARMING 


Installation Status : WARNING 

The PowerCenter Client 8.1.1 installation completed 
successfully. The information below summarizes the 
location and configuration of the installed products and 
components. Although PewerCenter Client 8.1.1 has 
been successfully installed and configured, same of the 
services may not have been started. Use 


D:/Informatica/PowerCenterB.1.1/nformatica Installatian | 
Client. Debug.lag far mare information. | 


Installation Date : 


Sun Nav 12 08:11:22 CST 2006 


Product Name : 


Insallerenere ey macrevistan 


[o Eo 


17-39 PowerCenter 安装 完成 状态 显示 








如 果 没 
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随后 可 选择 要 局 动 的 客户 器 工具 ， 如 图 17-40 所 示 。 


| 


INFORMATICA E Installation Complete 


Successfully installed PowerCenter Client components. Select 
the applications to launch and click Done. 


Select applications to launch: 

[C] PowerCenter Designer 

C] PowerCenter Repository Manager 
[C] PowerCenter Workflow Manager 
[ ] PowerCenter Workflow Monitor 
[C] PowerCenter Data Stencil 

[C] Metadata Manager Console 

C] Custom Metadata Configurator 


Install^memere ty Wacrevision 


11 
X 





17-40 PowerCenter 安装 成 功 


单 击 Done 按钮 ， 安 装 完 成 。 
17.2 Informatica PowerCenter 工 具 的 一 般 使 用 流程 


对 于 初学 者 来 说 ，Informatica PowerCenter 的 工具 组 件 有 点 复 杀 ， 比 较 容 易 混 消 ， 接 下 来 
进行 简单 的 工具 使 用 流程 说 明 ， 如 图 17-41 所 示 。 


启动 服务 引擎 一 Server 





Repository 
| PowerCenter 
—— Designer 

WorkFlow Manager 


监视 器 跟踪 Monitor Manager 


17-41 Informatica PowerCenter 工具 的 一 般 使 用 流程 





17.3 Informatica PowerCenter 快 速 入 门 


通过 学 习 Informatica PowerCenter 的 安装 ， 读 者 对 Informatica PowerCenter 工具 有 了 人 简单 
的 认识 。 接 下 来 通过 一 个 快速 入 门 的 实例 来 加 深 旋 者 对 Informatica PowerCenter 的 理解 。 
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17.3.1 前 期 准备 
1) 创建 源 和 目标 数据 库 。 以 DBA 喘 份 登录 数据 库 ， 执 行 以 下 脚本 。 


create USer BI SOURCE 
identified by "BI SOURCE" 
default tablespace BI ETL 
temporary tablespace TEMP 
profile DEFAULT; 
grant dba to BI SOURCE; 
grant unlimited tablespace to BI SOURCE; 
create user BI TARGET 
identified by "BI TARGET" 
default tablespace BI ETL 
temporary tablespace TEMP 
profile DEFAULT; 
grant dba to BI TARGET; 
grant unlimited tablespace to BI TARGET; 


2) 创建 源 数据 库 表 结构 。 连 接 到 数据 库 BI SOURCE， 执 行 以 下 脚本 。 

create table DEPT 

( 
DEPTNO NUMBER(Q() not null, 
DNAME VARCHAR?2(14), 
LOC VARCHAR2(13) 

); 

create table EMP 

( 
EMPNO NUMBER(4) not null, 
ENAME VARCHAR?2(10), 





JOB VARCHAR2(9), 
MGR NUMBER(4), 
HIREDATE DATE, 

SAL NUMBER(?,2), 


COMM NUMBER(7,2), 
DEPTNO | NUMBER() 


); 
插入 以 下 数据 : 


insert into dept (deptno, dname, loc) values (10, ACCOUNTING', NEWYORK); 
insert into dept (deptno, dname, loc) values (20, RESEARCH', DALLAS); 
insert into dept (deptno, dname, loc) values (30, 'SALES', CHICAGO); 
insert into dept (deptno, dname, loc) values (40, OPERATIONS', BOSTON?) 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7369, 
'SMITH', 
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'"CLERK'., 

7902, 

to date(11980-12-17', 'yyyy-mm-dd", 
800, 


20); 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7499, 
'ALLEN', 
'SALESMAN', 
7698, 
to date(1981-2-20', 'yyyy-mm-dd?, 
1600, 
300, 
30); 
insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7521, 
WARD! 
'SALESMAN', 
7698, 
to date(1981-2-22', 'yyyy-mm-dd^, 
1250, 
500, 
30); 
insert into emp(empno, ename, job, mgr, hiredate, sal, comm, deptno) values 
(7782, 
'"CLARK', 
'MANAGER', 
7839, 
to date(1981-6-9', 'yyyy-mm-dd?), 
2450, 


commit; 


插入 源 数 据 后 显示 如 图 17-42 所 示 。 


SQL | Output | Statistics | SQL | Output | Statistics | 


select * from enp t select * from dept t 
+% 
rE 
== 


ENAME [JOB —  |MGR |HIREDATE COMM BERINEIE 
7369 SMITH CLERK 7902 1980-12-17 ~ E 00 10 ACCOUNTING NEWYORK 
7499 ALLEN SALESMAN 7698 1981-2-20 = 1600.00 300.00 20 RESEARCH DALLAS 





DÌ e 








7521 WARD SALESMAN 7698 1981-2-22 - 1250.00 500.00 30 SALES CHICAGO 
7782 CLARK MANAGER 7833 1981-63 = 2450.00 40 OPERATIONS BOSTON 


mm [1:20 lempno, number[4], mandatory Z| mm O [1:1 [4 rows selected in 0 seconds — 7 


图 17-42 ”定义 源 数 据 





270 


3) 创建 目标 数据 库 表 结构 。 连 接 到 数据 库 BI TARGET， 执 行 以 下 脚本 。 


create table TARGET 

( 
EMPNO NUMBER(4) not null, 
ENAME VARCHAR?2(10), 
JOB VARCHAR?2(9), 
MGR NUMBER(4), 
DEPTNO NUMBER(), 
DNAME VARCHAR?2(14) 


); 
4) 在 Informatica PowerCenter Repository Manager 中 新 建 一 个 文件 夹 。 
首先 登录 Informatica PowerCenter Repository Manager， 如 图 17-43 所 示 。 








R Informatica PowerCenter Repository Manager - PE - [Bl xl 











Repository Edit View Folder wersioning Security Analyze Tools Window Help 


loo oo 


Repository Navigator x 


B Repositories 


Connect to Repository 


Connect to Repository 
Repository: Example 


Username: Administrator 
Password: p 


17-43 Informatica PowerCenter Repository Manager 登录 界面 


选择 菜单 Folder 一 Create， 如 图 17-44 所 示 。 
在 弹出 的 界面 中 创建 Folder 窗口 ， 填 入 要 创建 的 目录 名 ， 如 图 17-45 所 示 。 
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R Informatica PowerCenter Repository Manager - [Example] 


Delete Example 


-A Compare... | 


Administr... Administr... rwy 











17-44 创建 Folder 


Create Folder 


Tubo 





ld 17-45 创建 Folder 窗口 


erp 


创建 Folder 成 功 的 提示 信息 框 如 图 17-46 所 示 。 


Administr... Administr... rwx 
Administr... Administr... rwx 





Repository Manager 


ÀJ 


[^37 














图 17-46 创建 Folder 成 功 的 提示 信息 框 


打开 Informatica PowerCenter Designer ixt iri oK, AE] 17-47 所 示 。 


D 
D 


ooo er 


&3 Repositories 


d PowerCenter 8 Designer 


Setting the Standard for Enterprise Data Integration 


Getting Started Resource Center 
New Features and Enhancements Informatica.com 
my.informatica.com 


Developer Metwork 
Informatica Events 








Product Enhancement Request F 
Administrator [ 











Repository Folder Last Opened 


PowerCenter AUDIT DM GC ETL3 11/03/11 
09:38 EF 


AUDIT SHARE Cw 08/25/11 i 
AUDIT SHARE CW fosrzent INFORMATI 


| The Data Integration C 
Example Test 05/28/07 

10:51 EF 
PowerCenter AUDIT DM YX ETL3 05/27/07 

12:02 T^r 

05/27/07 

11:09 F4F 











17-47 登录 Designer 界面 
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进入 后 双击 刚才 新 建 的 目录 Test, Au 17-48 所 示 。 


D Informatica Powert Center De Sigl ner - [Source Analyzer - Test - [Example || 


ii 


ssSsssssasj 
elg 


O Start 5a JTest - [. 





17-48 Folder 展开 
到 目前 为 止 ， 前 期 工作 都 已 经 准备 好 ， 下 面 开 始 快速 入 门 过 程 。 
17.3.2 定义 源 数据 


在 Informatica PowerCenter Designer 设计 器 中 单 击 贸 按钮， 切换 到 Source Analyzer 视图 ， 
单 击 荣 单 Sources Import from Database， 导 入 源 数 据 ， 如 图 17-49 所 示 。 





PowerCente Designer S mm e [Ex ample]] 





| af yer from WSDL Consumer). 


UE 


a | 


TPP 


f 
二 
i 
| 





Ir 








图 17-49 ”导入 源 数据 
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弹出 Import Tables 对 话 框 ， 如 图 17-50 所 示 。 


Import Tables X 


OK | 
(Cancel | 
Help | 


Connect to Dababase 


ODBC data source: [dBASE Files {Microsoft dBase Driver (*.dbF7) | Er | 
Username: | 


Owner name: 







ww 
C] 






Password: 


Shaw owners: 


| Default 


Select all 


Select nane | 





17-50 Import Tables 对 话 框 


单 击 -按钮 ， 弹 出 ODBC 数据 源 管理 器 ， 如 图 17-51 所 示 。 
"oC ECT RC E-: 
用 户 DSH | 系统 DSH | 文件 nsu | 驱动 程序 | 跟踪 “| 连接 池 | 关于 | 


APGE U: 
驱动 程序 hn qu... | 


dBASE Files Microsoft dBase Driver (x*. dbf] 

Excel Files Microsoft Excel Driver [*. xls] 删除 (R3 | 
localhost Dracle in ÜüralblÜüz homel 

MS Access Database Microsoft Access Driver (Ü*.mdb] 

DECL Oracle im Dralbiüe homel ROE IE)... | 





17-51 ODBC 数据 源 管理 器 


创建 一 个 数据 源 ， 单 击 “ 添 加 ”按钮 ， 选 择 要 添加 的 数据 源 驰 动 ， 如 图 17-52 所 示 。 
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HENARE 


VE TF a A E Sce rf STRE TTE FE (8). 


Microsoft FoxPro VFF Driver I*. dbf) 
Microsoft ODBC for Oracle 

Microsoft Paradox Driver C, db J 
Microsoft Paradox-Treiber (X*.db ) 
Microsoft Text Driver (Uk txt; *, csv] 
Microsoft Text-Treiber (x. txt; *. csv] 
Microsoft Visual FoxPro Driver 
Microsoft Visual FoxFro-Treiber 
Üracle in Üüralbiüzg homel 

SUL Server 


4 lij | 








图 17-52 ”创建 新 数据 源 


单 击 “完成 ”按钮 , 在 弹出 的 Oracle ODBC Driver Configuration (Oracle ODBC 驱动 配置 ) 
对 话 框 中 ， 输 入 源 数 据 库 配置 参数 ， 如 图 17-53 所 示 。 


Üracle ODBC Driver Configuration 


nk | 
Data Source Name arcel 
E l | 
Description fire ance 
[ 0R Help | 
HS Service Mame CL T 


Test Connection 
User ID [BI SOURCE . Test Connection | 


Application | Oracle | Workaroundsz | SHL errer Migration | 
Enable Result Sets [w Enable Query Timeou|* Read-Only Connectio| 


Enable Closing Curze| Enable Thread Safet 


Batch AÁutocommit Mode [Commit only if all statements succeed ”| 
Humeric Settings [use Üracle HIS settines | 





图 17-53 ”输入 源 数据 配置 参数 





寺 好 后 ， 单 击 Test Connection 按钮 进行 测试 ， 如 图 17-54 所 示 。 


Oracle ODBC Driver Connect X 


Service Mame 


[prec 


User Hame ER 
本 a | 
Password 

= About... | 


| MENMEXXEXEXX 





图 17-54 ”建立 连接 
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单 击 OK 按钮 ， 弹 出 测试 成 功 提 示 框 ， 如 图 17-55 Br. 


Oracle ODBC Driver Configuration 


0K 
Data Source Mame [orc ok | 
C | 
Description [fire o Cancel | 
Hel 
THS Service Name |oRCL -| o He | 


Test Connection 
Lizer ID [BI SDURCE . Test Connection | 


Iesting Connection [x] 


Application | Oracle | Works l 
Connection successful 


Enable Result Sets [jw 
确定 





Enable Closing Cursof 


Bateh Putocommit Mode [Commit only if all statements succeed "| 
Numeric Settings [use (üracle HIS settings "| 





17-55 测试 成 功 提 示 框 
frt ODBC 数据 源 管理 右 会 看 到 orcl 一 项 ， 如 图 17-56 所 未 。 
"ODBC 数据 源 管 理 器 |? |x] 
用 户 DSW | 系统 psu | eb psw| 驱动 程序 | 跟踪 ”| 连接 池 | 关 于 | 


用 中 数据 宰 Qn: 
RA QD... | 

















dBASE Files Microsoft dBaze Driver (*.dbf] 







Excel Files Microsoft Excel Driver (Ü*.xlz] HRE i | 
localhost Dracle in Üürallbilüz homel 

MS Access Database Microsoft Access Driver UÜ*.mdb! 

DECL Oracle in OrdDbiDs home] AcE ED... | 





orcl Dracle in Üürallbilz homel 






TE | RB | Fe FB GRO | 帮助 | 





17-56 ODBC 数据 源 管理 器 





确定 后 ， 返 回 Import Tables XIIE, Æ ODBC data source 下 拉 列 表 中 选中 刚刚 创建 好 的 
数据 源 ， 如 图 17-57 所 示 。 
V 


&3 Repositories 
C Bb Example 
: (2 example Import Tables 





orcl (Oracle in OraDb10g. home) v 
Adaptive Server IQ Demo (Adaptive Server IQ) 一 | à 


(2 Targets dBASE Files (Microsoft Access dBASE Driver (*.dbf, *, 
Cubes Excel Files (Microsoft Excel Driver (*.xls, *.xlex, *.xls | 
Dimensions MS Access Database (Microsoft Access Driver (*,mdb 


orcl (Oracle in OraDb10q homel) 
Transformatior 
Mapplets 
Mappings 








Select none 














图 17-57 导入 数据 源 





输入 用 户 及 密码 ， 单 击 Re-connect 按钮 ， 在 下 方 选中 要 导入 的 源 数 据 表 ， 再 单 击 OK 按 
&H. 17-58 所 示 。 


-TY 


&3 Repositories 
J- Bb Example 
(2 example 




















DEPT 
EMP 




















图 17-58 ”导入 源 数据 表 
最 终 定义 好 的 数据 源 如 图 17-59 PTR. 
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nmm 
yeg 





6 Mapplets | | | E | e 177799977 977999977) 9VJJT9TVFVTPPPP? 177797777719 HIL) 
LJ A 

[^ EMP (Oracle A - E 

P onan — — - er 

LAC 2^ MENU ^... d I 


4 

| 10 
9 — 
E 
19 
E 

Lr 
jg 


| 


| 


| 


I 
(b aD 
Sg. 


2 Aii H m 
"IT777777777777777777777777777777777777777777777777777777777777772777ZA 





图 17-59 ”定义 好 的 数据 源 


17.8.8 定义 目标 数据 


在 Informatica PowerCenter Designer 设计 器 中 单 击 氏 按钮， 切换 到 Targets Analyzer 视图 ， 
单 击 荣 单 Targets Import from Database， 导 入 目标 数据 ， 如 图 17-60 所 示 。 





D Infc rme ath a PowerCenter Designer - [Target Designer - Test - [Example]] 











H Edit Cube.. 
s Close Cube 


E 


4 Generate/Execute SQL... 





© Start Page ls A leto z E 5 | 





17-60 “导入 目标 数据 


2/09 


其 创建 过 程 与 创建 源 数 据 一 致 ， 在 这 里 不 再 详细 讲解 ， 如 图 17-61 所 示 。 


&3 Repositories 
日 … 上 Example 
: H- ff example 


Business Components 
Sources 
外 orcl 

Targets 

|. TARGET (Oracle) ami 
Cubes ; 
Dimensions 
Transfor mations 
Mapplets 


Mappings 3 D DEPTNO |. number (p, s) f 
2 — DHAME varchar2 — / 
—- : ; 


A 
» 
ood dda 











图 17-61 目标 数据 工作 区 


17.3.4 定义 映射 规则 


在 Informatica PowerCenter Designer 设计 器 中 单 击 路 按 钮 ,切换 到 Mapping Designer 视 图 ， 
在 Repository Navigator 中 ,， 拖 动 源 数据 表 DEPT 和 EMP 到 右 侧 的 Mapping Designer 视图 ， 弹 
出 Mapping Name 对 话 框 ， 如 图 17-62 所 示 。 


(p Test - [Example] ~ [cu] ES [à. K ** | E 
JOO | 
&3 Repositories 
C BP Example 
: Ø example 


Business Components 


Mapping Name 





Dimensions 
Transfor mations 
Mapplets 
Mappings 











图 17-62 创建 映射 规则 
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输入 映射 名 后 单 击 OK 按钮 ， 这样 源 数据 表 DEPT 和 EMP 就 显示 在 右 侧 了 ， 接 着 把 源 数 
据 表 DEPT 和 EMP 以 及 目标 表 TARGET 拖 入 右 侧 ， 右 侧 视 图 最 终 如 图 17-63 所 示 。 


DEPT (üracle] 7 £ü DEPT 
Source Definition Source Qualifier 


E Hame 


EMP (üracle] 
Source Definition 





图 17-63 ”映射 工作 区 





单 击 | 况 按钮， 然后 在 Mapping Designer 视图 中 单 击 鼠 标 左 键 ， 创 建 一 个 Joiner 的 
Transformation， 如 图 17-64 所 示 。 


DEPT (Oracle) SQ DEPT 


Source Definition Source Qualifier 





decimal 
string 
string 











JHRTRANS 















EMP (Oracle) 
Source Definition 













. Name 
; EMPRO numb 








Name 
EMPNO 



































: ENAME varc ENAME 
; JOB varc 

; MGR b JOB 

: numa MGR 


; HIREDATE 


s- ed 


HIREDATE 











图 17-64 ”创建 Joiner 的 Transformation 


将 图 17-64 中 左边 两 个 表 中 的 字段 均 拖 入 到 刚 创建 的 Joiner 中 ， 然 后 将 Joiner. 中 的 
DEPTNOI 和 DEPTNO 用 鼠标 选中 并 与 右 侧 的 Target 建立 连接 ， 最 终 效 果 如 图 17-65 所 示 。 
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DEPT (Oracle) 
Definition 





Source 











DNAME string 
LOC string 





[*I*I*] 




















er JNRTRANS 
Joiner 









| Source 

Detail 
DNAME Detail 
LOC Detail 
EMPNO Master 
Master 












EMP (Oracle) 
Source Definition 






































图 17-65 ”映射 工作 区 效果 图 


接着 ， 双 击 Joiner 表 头 ， 在 弹出 的 对 话 框 中 选择 Condition 选项 卡 ， 单 击 # 按 钮 ， 新 建 关 
KRR, Hah "ask" TH, UE] 17-66 prn. 


Edit Transformations | x| 


Transformation | Forts | Properties Condition | Metadata Extensions | 





Select 


Transformati orn [oiner m d ir* + 3 
Haster Dperator Detail 一 


ne T 000 pem 





图 17-66 Transformations 编辑 器 





至 此 ， 映 射 规则 定义 完成 。 最 终 效果 如 图 17-67 HR- 
请 千 万 不 要 瑟 记 保存 我 们 的 荔 动 成 末 ! 
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DEPT (Oracle) 


Ld SQ DEPT 
urce Definition " Source Qualifier 














| decimal 
| string 
string 


























E777277777727]77727]7]727]7]777]2]27]7]2]7 277] 9*2 2722. 

D TARGET lOracle) 
-48 z 
' Target Definition 





Detail 
Detail 
| Detail 
; Master 
| decimal | Master 
string ; n.i 
string — 了 
* Ur7727222222220 222 2 22 244 2 2 4 H2 2 222777272 2 2 7 2 / TT YA 
decimal 


HIREDATE date/ti 







































































Output Window 


Parsing mapping m testl... 
...parsing completed with no errors. 


PEE Mapping m testi is VALID kk 


mapping m testl inserted. 
mapping Examplel deleted. 


E Lr Do save 





图 17-67 Designer 效果 图 
17.8.5 EXTER 


oleo o 面板 中 的 加 按钮 , 打开 Informatica PowerCenter WorkFlow Manager 流程 设计 
器 ， 如 几 17-68 所 示 。 


W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example]] 


(SR [gre bmd me] om eem x 


agarz oo g 


&3 Repositories 
日 … B Example 


à g PowerCenter Integration Service 
由 … Ø example 








图 17-68 Informatica PowerCenter Workflow Manager 界面 


2835 


> S eam le Start Workflow 
I i P Recover Workflow 


目 PowerCenter Integration Service 


(2 example 
al Schedulers... 


Dependencies... 








图 17-69 Workflow [1] 5 


首先 ， 在 弹出 的 工作 流 创 建 导 航 对 话 框 中 输入 要 创建 的 名 称 ， 然 后 单 击 “下 一 步 ”按钮 ， 


Workflow Name (Step 10f 3) aa 


如 图 17-70 所 示 。 


Wor Wizard - 


wf_testl| 


= i 
|FowerCenter Integration Service Ed 


I 
IM 
TL 
IM IM 


AT 





图 17-70 输入 Workflow 名 称 
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其 次 ， 将 左 侧 的 m_testl 映 届 选项 ， 选 中 到 右 侧 的 Sessions to be 列表 中 ， 单 击 “ 下 一 步 ” 
按钮 ， 如 图 17-71 Bron. 


Workflow Wizard - Create Sessions (Step 2 of 3) 






Sessions 


Select the mappings that you want to create sessions for. 
Use the arrows on the right to specify the order of the sessions in the workflow. 


Select the mappings: Sessions to be 5 T + 
Ez 





» 


[5 Run a session only. rf the previous session completed 
successfully. 


ms | wm | 
图 17-71 创建 会 话 
然后 ， 在 该 对 话 框 中 可 以 进行 抽取 周期 设置 。 比 如 ， 当 前 执行 、 某 天 某 时 执行 一 次 、 
天 明了 上 执行 一 次 、 每 个 月 某 日 执行 一 次 等 。 在 这 里 选择 默认 方式 ， 即 立即 执行 方式 ， 然 后 单 
击 “ 下 一 步 ” 按 钮 ， 如 图 17-72 Br. 


Workflow Wizard - Schedule Workflow (Step 3 of 3) 


Schedule Torkflomw 
Enter the scheduling information for this workflow. 













Eun Üptionsz: Schedule Üüptions: 












(* Run once 





lays Hours Mimute: 


(C Run every 加 — [| - LH 
C Customized Repea Edit... | 


[^ Run on demand 





[ Run continuously 





End Üüptionz: 
C Enim [eoor 5-28 zj 
(* End afte hh run ls. 


Ü Forever 


Start options: 


Start [z507- SLE r | 


Start 11 : 3n =x 


















sorn] wm | 到 | 


图 17-72 ”抽取 周期 设置 
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最 后 ， 单 击 “ 完 成 ”按钮 ， 如 图 17-73 所 示 。 


ow Wizard - Finish 


Integration Service PowerCenter Integration Service 


Run on demand 


由 


(NT 
MM 


VM 
Ili 


ANNUM 


| 
I 


TAIN 
II 





图 17-73 Workflow 创建 完成 界面 


完成 后 ，Workflow Manager 管理 器 显 示 如 图 17-74 所 示 。 





W Informatica PowerCenter Workflow Manager - [Workflow Designer - Test - [Example]] 


aosoexieioomwo klesala CO 8j o & $ |^. | e Ga 


AE 


nor 


&3 Repositories 
J- Bb Example 
; g PowerCenter Integration Service 


六 example 





Worklets 
workflows 








图 17-74 Workflow Manager 管理 器 界面 
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框 中 单 击 New 按钮 ， 如 图 17-75 所 示 。 
选择 数据 库 类 型 ， 如 图 17-76 所 示 。 





Relational Connection Browser — Fo... E3 


ij Relational Connection Browser 


T] Relational Connection Browser 


mmi Select Subtype E x] 
Sele 

Select Type: cies 2 

E ALL EEFE- s =| [ee 


Help 


最 | 
| mme 










icrasofE SQL Server 







Pawerchannel Far DEZ 
PoawercChannel For M5 SQL 5 
Powert hannel Far ODBC 
Powerchannel For Oracle 
Pw DB2390 

Pw DB2400 了 | 


awerChannel Far Oracle T | 
awerChannel Far MS SOL Server - 一 
EW fes, | 


MM warehouse Edit... 
MM wH Conn 


Delete | 









Copy As... | 


图 17-75 ”关系 型 数据 库 设置 图 17-76 ”选择 数据 库 类 型 





输入 数据 库 连 接 源 信息 ， 如 图 17-77 所 示 。 
同样 ， 创 建 目标 数据 库 ， 最 终 效 果 如 图 17-78 所 示 。 人 然后 关闭 对 话 框 。 


Connection Object Definition | x| 


T] Relational Connection Editor 
PEE E Relational Connection Browser m. XI 


IE | x | Relational Connection Browser 
Type: [orade E | Cancel | —á 
iud [EI SOURCE Help | Select Type: close | 
Password: [ree peek npo 村 站 站 站 ~ y = 
Connect String: [ord Obieck Help | 
bjecks: 
Edit | 








Code Page: [ms windows Simplified Chinese, : ™ | 


Attributes: 


| Attribute | LET E:T- 
E 


Transaction Enviro... 


Delete 








Permissions... | 
S 
d Copy As... | 
E: 


oawercChannel For DEZ 









图 17-77 ”输入 数据 库 连 接 源 信息 图 17-78 创建 目标 数据 库 
接着 在 Workflow Designer 视图 中 双击 Session 按钮 ， 弹 出 Edit Tasks 窗口 ， 如 图 17-79 
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所 不 。 
ini xl 


General | Properties | Config Object | Mapping | Components | Metadata Extensions | 


Select um s m testi 
Task type: Session [ Make reusabl 


Descripti: 





Mapping m testl 
Resources | 


[ Fail parent if this task Treat the input links as: 
[ Fail parent if this task doe (* AND C OR 


[ Disable this task 





m | ceo | am | 


图 17-79 Edit Tasks 窗口 


选择 Mapping 选项 卡 ， 单 击 左 侧 Sources 选项 组 下 面 的 源 数 据 表 ， 然 后 在 右 侧 的 
Connections 下 单 击 到 按钮 ， 如 图 17-80 所 示 。 


Edit Tasks - [B| x| 


General | Properties | Config Übject Mapping | Components | Metadata Extensions | 


Task type: Bession — 
Q Start Page 
Q Pushdown Optimization Z 


& Connections EPECHSIEN Readers 


& Memory Properties Relational Reader v 


Q Files, Directories and Com 
日 LJ Sources 
$0 SQ DEPT z 
$0 5Q EMP Eoi [le 
B C Targets SQ SQ DEPT — DB Connection 
$$ TARGET 
日 LJ Transformations 


39 JNRTRANS 





















$Q 39 DEPT 






Relational 









: Show Session Level Properties 
åttribute LESE T: 一 


E Sq 59 DEPT - Source Qualifier 


User Defined Join 

Humber Of Sorted Ports 

Tracing Level Normal | 
o8 Tran... | B> Parti... | < Please pick a connection > 


m | uo | am | 


lk 17-80 Connections 设置 


在 弹出 的 对 话 框 中 选择 数据 源 ， 如 图 17-81 所 示 。 
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loj x| 


m LETT Connection Browser xj 








ke s_m_testl 


Start Page 
€ Pushdown Optimization 
€ Connections 
€ Memory Properties 
€ Files, Directories and Com aee aD k ss 
日 LJ Sources i 
sü 
SA SQ EMP 
日 LJ Targets 
$$! TARGET 
日 LJ Transformations 
39 JNRTRANS 

















Ed: GS) 





17-81 关系 型 数据 库 设置 
单 击 “确定 ”按钮 后 显示 如 图 17-82 所 示 。 





$0 58 DEPT 一 DB Connection 
Relational SOURCE 


17-82 ”数据 库 连 接 


同样 ， 在 Targets 选项 组 中 将 其 选 为 目标 数据 库 ， 并 且 在 Properties 属性 中 设置 参数 ， 如 
图 17-83 所 示 。 


Edit Tasks 











mmm e a 
Q Pushdown Optimization || x [T91393- E | 
È Connections [| 0 agastence | Riters 000 
cce quiu. -. fn sn 


€ Files, Directories and Com 
日 LJ Sources 
SA 5Q DEPT 





Connections B- | 


S TARGET C————— 
日 LJ Transformations Type 一 
mains 





Properties 


Attribute 
E TABCET 一 Relational Writer 


Target load type 


Update as Update 
Update as Insert 
lo else Insert 


We Please pick a connection > 








17-83 Properties 设置 
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至 此 , 工作 流 部 分 设置 完成 。 在 Informatica PowerCenter Workflow Manager 设置 器 中 单 击 
4# Repository Save. 


17.3.6 ”局 动工 作 流 程 
方法 一 : 在 Worflow Designer 视图 的 空白 位 置 单 击 忌 标 右键 ， 在 弹出 的 快捷 来 单 中 选择 


Start Workflow 命令 。 

方法 二 : E4 £e 99?* mpg qm. 

启动 后 ，Informatica 将 自动 打开 工具 PowerCenter Workflow Monitor, 4j 4-8 $1] Succeeded 
字样 ， 则 说 明 工 作 流程 局 动 成 功 ， 如 图 17-84 Dn. 


M Informatica PowerCenter Workflow Monitor 
Repository Edit view Tools Task Filters Help 


OGRAJA «|nlalisw|v-i w= s|r*35 


a I NNUS CU CE 
, um xia s |1l:00am |12:00pm (1:00pm |2:00pm 3:00pm [4:00pm |5; 


Repositories 
o8 Example 

i B9 PowerCenter Integration Service 01:09:08 Connected 

Bm. Test 

日 人 入 w£ testi 00:00:02 | Succeeded 

--[fe 00:00:02 ^ |Succeeded 


























Properties 


[2007-5-28 11:50:05] 
Y Task Details 


Attribute Hame Attribute Value ^ 
mj 


Instance Name s m testl 

Task Type Session 

Integration Service Name PowerCenter Integration Service 
Node (s) nodeO01 20100729-1030 

Stort Tima 2ü0(07-5-28 11-5605 

MA Source/Target Statistics 


Transformation Hame Applied Rows | Affected Rows Throughput (Rows/Sec) Last Error ... | Last Error ^ 


EE SQ SQ EMP 
: 0 $A Partition #1 | nodeD1 : 2.. No errors E 
Ej- 45] TARGET 


- 
> C 











3 [Output Window 


17-84 PowerCenter Workflow Monitor 界面 


使 用 “BI TARGET" HPF 4&Xf5& PL/SQL Developer 工具 ， 奏 询 目标 表 数 据 后 ， 显 示 如 
图 17-85 所 示 〔 原 来 该 表 中 数据 为 室 ， 现 插入 4 条 数据 )。 


> SQL Window - Query data of table TARGETG@OREL 
SQL | Output | Statistics | 


elect * from target t 


= 口 | xj 











[ENAME | 
7782 CLARK 10 ACCOUNTING 
7369 SMITH 20 RESEARCH 
7521 WARD 30 SALES 
7499 ALLEN 30 SALES 





17-88 ”目标 数据 
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下 面 给 出 一 个 直观 的 数据 图 ， 以 便 大 家 学 习 。 其 中 ,图 中 上 半 部 分 两 个 表 为 BL SOURCE 
源 数据 库 中 表 ， 下 半 部 分 为 经 过 ETL 处 理 之 后 ，BI TARGET 目标 数据 库 中 表 中 的 记录 ， 如 
17-86 所 示 。 


”SQL Window - Query PIISIESI ^ SOL window - Query date 
SQL | Output | Statistics | SQL | Output | Statistics | 


select * from dept t select * from enp t 
X + 
Dic] ru 
E Em] 


co 
b 1 7369 SMITH CLERK 7902 1980-12-17 = 800.00 20 









































10 ACCOUNTING NEWYORK 


20 RESEARCH DALLAS | [a 7433 ALLEN SALESMAN 7638 1981-2-20 = 1600.00 300.00 30 
30 SALES CHICAGO | [3 7521 WARD SALESMAN 7638 1981-2-22 = 1250.00 4 500.00 30 
40 OPERATIONS BOSTON |4 7782 CLARK MANAGER 7833 1981-6-9 = 2450.00 















SL | Output | Statistics | 


select * from target t 
" 











Hi -| I | dà | F | | =] 
MGA 


JOB 











7782 CLARK MANAGER 7833 10 ACCOUNTING 
7353 SMITH CLERK 7302 20 RESEARCH 

7521 WARD SALESMAN 7538 30 SALES 
7433 ALLEN SALESMAN 7698 30 SALES 
















[4 rows selected in 0 seconds 








图 17-86 Zt ETL 处 理 的 源 数据 和 目标 数据 


17.4 本 章 小 结 





1) Informatica PowerCenter 的 安装 分 为 : 服务 嚣 安装、 客户 端 安装 。 

2) 在 Informatica PowerCenter 服务 右 的 安 钱 过 程 中 ， 和 需要 提前 创建 以 下 4 个 数据 库 : 

@ 资源 库 。 

e 数据 分 析 库 : 存储 在 数据 分 析 过 程 中 产生 的 数据 参数 指标 。 

e 元 数据 管理 库 : 在 设计 过 程 中 产生 的 一 系列 数据 及 参数 指标 均 保 存在 该 数据 库 中 。 

e 域 配 置 数 据 库 存储 域 配置 过 程 中 的 参数 指标 。 

3) 在 域 控 制 台 ， 可 以 对 域 对 象 进 行 管理 ， 例 如 服务 (Services)、 节 点 (Nodes). FJ 
(Licenses) 和 网 格 (Grids). 

4) Informatica PowerCenter 的 一 般 开 发 流程 为 : 局 动 服务 引擎 一 定义 资源 库 一 数据 抽取 
流程 设计 一 工作 流 管 理 一 监视 跟 踩 。 

5) 启动 工作 流程 。 

方法 一 : 在 Worflow Designer 视图 的 空白 位 置 单 击 限 标 右键 ， 在 弹出 的 快捷 闻 单 中 选择 
Start Workflow 命令 。 

方法 二 : dpé £4 88+ mpm qi. 

局 动 后 ，Informatica 将 目 动 打开 工具 PowerCenter Workflow Monitor, 如果 看 到 Succeeded 


字样 ， 则 说 明 工 作 流 程 局 动 成 功 。 
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第 18 章 Informatica X4 


本 章 目 标 

第 17 ENAT Informatica 的 安装 及 快速 入 门 , 本 章 将 通过 绥 慢 变化 维 的 儿 种 解决 方式 来 
进一步 介绍 Informatica 工具 。 

尝 习 本 章 后 ， 您 将 掌握 : 

e Ea ERER o 

e 绥 慢 变化 维 的 实现 方式 。 





18.1 缓慢 变化 维 的 概念 








在 现实 世界 中 ， 维 度 的 属性 会 随时 间 的 流逝 而 发 生 绥 慢 的 变化 。 将 发 生变 化 的 维度 称 作 
“ 绥 慢 变化 维 ”， 它 是 一 种 ETL 对 数据 仓库 维度 表 的 更 新 技术 。 举 例如 下 : 

在 销售 行业 的 数据 仓库 中 ， 如 果 某 销售 人 员 从 A 地 区 调 到 B 地 区 ， 那 在 统计 这 名 销售 人 
员 的 销售 记录 和 销售 业绩 时 ， 在 调 离 前 应 该 算 在 A 地 区 的 销售 记录 ， 调 离 后 应 该 算 在 B 地 区 
的 销售 记录 。 如 何 处 理 这 名 销售 人 员 所 属 区 域 的 变化 ?这 就 是 研究 绥 慢 变化 维 的 原因 |。 

在 数据 仓库 中 ， 事 实 表 的 设计 通常 包含 多 个 代理 主键 ， 周 围 环绕 看 多 个 维 表 ， 当 维 表 的 
数据 发 生变 化 时 ， 数 据 仓库 需要 立刻 发 现 这 种 维度 的 变化 。 下 面 用 Informatica PowerCenter 
工具 去 实现 绥 慢 变化 维 的 多 种 解决 方案 。 


18.2 缓慢 变化 维 的 实现 方式 


18.2.1 ”覆盖 方式 


源 表 : src_dxpcode。 
表 结 构 如 图 18-1 所 示 。 


CAE varco | | 
pywE RR — | — | ——— 
































图 18-1 src dxpcode 表 结 构 


数据 如 图 18-2 所 示 。 
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[CODE | HANE [TBHANE PEHANE ADDID ADDBLOB (TIPE CODELVL 
xoEN w wm — p o EO —— 
GXOWAWR Gu amr Do d 08 000 
mmm eur gr 
33006 SERIE on 

33007 | 通讯 录 — (GBTXL [GETEL 
0 设置 ET — 

E LAN: 


Gm 
au 
D 
TK 
NK 
ke 
后 一 
E 
mc 


i 
i 


i 


2 
HII 
FAC 
HI! HII 
HD 


HD 


i 
TE 
E 

mear o koo 

SL |] p B 

sr ho p p 

mx 1 p —p 

m p e p 

x p p p 

gB p p | 

E 2 

m p p 

mk op p -— 

gu p p o 

6 一 一 


TOT 
AO 


一 
p 
p 
D— 
p 
MK 
JEN 
o 
NÉ 
p 
o 
o 
P 


xii Men — (TEQKBGE 





图 18-2 sre dxpcode 表 数 据 


目标 表 : newtargetO. 
表 结 构 如 图 18-3 所 示 。 


Pm Peman WEER | | 





图 18-3 newtarget0 表 结 构 


步骤 1: 在 缓慢 变化 维 向 导 中 选择 Slowly Changing Dimensions 〈 绥 慢 变 化 维 ) 命令 ， 如 
18-4 HIZR o 


| Wizards Getting Started... 
Debugger + Slowly Changing Dimensions... 


图 18-4 REAM HE n 





步骤 2: 选择 Type 1 Dimension 单 选 按钮 ， 如 网 18-5 Drzn. 


Wew Mapping name: 


[n sLovlyChanginglemo 


Type 





(* Type 1 Dimension - keep most recent values in targ 


C Type 2 Dimension - keep a full history of changes in the 


C Type 3 Dimension - keep the current and previous values in the 


ma | wm | 





图 18-5 “模式 ”对 话 框 
步骤 3: 选择 源 表 和 目标 表 ， 如 图 18-6 所 示 。 


Select Source Table 


[orel:SRC DXFCODE "| 


Hew Target Table 


吓 YTARSETO| 


ma | wm | 





图 18-6 ”选择 源 表 和 目标 表 
步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
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震 要 对 比 的 字段 ， 如 图 18-7 Pr. 











图 18-7 选择 器 
步骤 $: ERENER IERI HE Mapping， 如 图 18-8 Przs 


Ri Generatek 


e XE 


SRC DXPCODE ( A SRC_DXPCOD LKP_GetData 
Oracle) E 


~、 
EXP DetectCha \ FIL InsertNew UFD Forcelnse NEWTARCETO [0 
nges land rts racle) 


BN E 
BT n . p , 4 


FIL UpdateCha UFD_ChangedUpy NEWTARCETO1 Í 
ngedREecord date Dracle) 





图 18-8 映射 工作 区 
整个 Mapping 分 成 两 个 部 分 : 新 数据 的 插入 和 更 新 数据 ， 如 图 18-9 所 示 。 


€ 
"P 


sar DXPCODE (SQ SAC DIPCOD LX? CetData 
Oracle) 


^ pp 
pr 


"f y (i 7 


EXP DatectCha | IL_Inser EI WPD Porcelnse NEWTANGETO U 


agas Ei r£! rtt Fadey 


ze 
M 4 
| f 
PD Changi ::p 
ia ta 





图 18-9 ”映射 工作 区 的 数据 区 
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ChangedFlag: 用 于 判断 数据 发 生 改 变 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 其 值 为 tue， 该 Mapping 执行 更 新 数据 的 操作 ; 否则 为 false, ^ 
执行 更 新 操作 ， 如 图 18-10 所 示 。 

















IIF(NOT ISNULL (PM PRIMARYKEY) = 


AND 

( 

DECODE (ADDBLOB, PM PREV ADDBLOB,1,0) = 0 
OR 

DECODE (ADDID, PM PREV ADDID,1,0) = 0 

OR 

DECODE (CODELVL, PM PREV CODELVL, 1,0) = 0 
OR 

DECODE (NAME, PM PREV NAME,1,0) = 0 

OR 

DECODE (PKNAME, PM PREV PKNAME, 1,0) = 0 
OR 

DECODE (TBNAME, PM PREV TBNAME, 1,0) = 0 
OR 

DECODE (TYPE,PM PREV TYPE, 1,0) = 0 

), TRUE, FALSE) 


图 18-10 ”代码 片段 


NewFlag: 用 于 判断 该 数据 是 否 为 狐 数据 的 标识 字段 。 如 果 目 标 表 中 不 存在 该 数据 ， 则 其 
值 为 ttue， 该 Mapping 执行 插入 新 数据 的 操作 ; 否则 为 false， 不 执行 插入 操作 。 


IIE(I2MDTT (bW BEIWVEAEEA)' IEDE' EYVT 2E) 
第 一 次 执行 该 Mapping 时 ， 目 标 表 的 数据 如 图 18-11 所 示 。 


PN PEINARIKET CODE | NANE  TBEANE FENANE [ADDID ADDBLOB [TTFE CODELYL. 


图 18-11 目标 表 的 数据 
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To 133017 | 追究 IET zT i E TT n 
m [23018 | 活动 加 加 n n P 
T 33019 [Ert horre porr fo [T n i 
m3 —  gaeogEERU Er zug 0o — 0 —ng! |» ——— 
[Ta [33021 | 情况 报告 ^ TSüKBGB [TSGKBGB [D [T n 





图 18-11 目标 表 的 数据 ( 续 ) 
总 结 : 窗 新 方式 是 绥 慢 变化 维 中 相对 简单 的 一 种 方法 。 其 特点 是 保证 数据 仓库 中 的 数据 








始终 是 最 狐 的 ， 丰 你 留 历 史 数 据 。 如 果 友 现 狐 数据 ， 则 将 新 数据 加 载 到 目标 表 中 。 如 果 数 据 
发 生 改 变 ， 则 执行 更 新 操作 。 


18.2.2 全 历史 记录 


源 表 : sre dxpcode. 
表 结 构 如 图 18-12 所 示 。 


FE ACID | | 
Pme ACE o | ——— 


图 18-12 src dxpcode 表 结 构 





数据 如 图 18-13 所 示 。 


CODE| HANE (TENANE PENANE [ADDID [ADDBLOB |TTFE CODELYL 
mmus mu p 0 gp à o 


图 18-13 src dxpcode 表 数 据 
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图 18-13 src dxpcode 表 数 据 ( 续 ) 





HERK: newtargetl. 
表 结 构 如 图 18-14 所 示 。 


i wo | —— | —— [o 
i (Y 一 


图 18-14  newtargetl 表 结 构 





步骤 1: 在 缓慢 变化 维 向 导 中 ， 选 择 Slowly Changing Dimensions〔( 绥 慢 变 化 维 ) 命令 ， 
如 图 18-15 所 示 。 


| wizards Getting Started... 
Debugger d Slowly Changing Dimensions... 


K| 18-15 ZEE HER] SE 





步骤 2: 选择 Type 2 Dimension 单 选 按钮 ， 如 图 18-16 所 示 。 
步骤 3: 选择 源 表 和 目标 表 ， 如 图 18-17 所 示 。 
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m fullhistorychanges| | 





图 18-16 模式 向 导 


orcl:SRC DXPCODE Bd 


HEWTARGET1| | 











图 18-17 WKM HERK 


步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
需要 对 比 的 字段 ， 如 图 18-18 PR. 





图 18-18 选择 器 
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步骤 S: 生成 标准 的 全 历史 记录 型 版 本 号 缓慢 变化 维 Mapping. AE 18-19 PZR. 


SRC DEPCODE 【人 


Oracle] 


200 == e 7 BN - 


EN | E " i E "Lat 
EXP DetectCha i FIL_InsertHew UFD ForceInze HEWTARBEETi1 (O 
TIEES Eecord rts racle] 


WW > 7] -ý V 


Serre E 1 
FIL Inserttha UFD ChangedIn EXP KerFraces ^ 

i 
ngedhecord saris sing InseriCh | 


1 
anged A 
E | 
Tue A 
~e 4 


HEWIARBCET11 í 


Draclel 





图 18-19 ”映射 工作 区 


整个 Mapping 分 成 两 个 部 分 : 新 数据 的 插入 和 将 旧 数 据 的 每 次 变化 插入 到 目标 表 中 ， 如 
图 18-20 所 示 。 


SE EEP LerProcez 
PLI EFT 


; 
ms -, 
ume Fj = h 
本 Eti T ui 
: 
ig, k 


IE. ~ 
SH DXFCODE | Sy ZBL BXFCUD LEF 
Driglal E 


> 加 一 十 * = = 


EKF TITAN l FIL_IonreriHew WPi ES TET. WEFTAEGETI1 (D 
ngáz | Eecord tba THE T 


FIL IsBzériCbha DFD HT TT ETE 
LTD E res] fi Teris zimg inzartCh 


LEO "T | 
4 | 
| 
rm 
H 
M 


HNENTAXCET11 | 
Oracle) 





图 18-20 ”映射 工作 区 的 数据 区 


ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存在 有 差异 的 字段 值 时 ， 则 其 值 为 tue， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目标 


300 


表 中 的 操作 ， 如 图 18-21 所 示 。 


IIFiNOT ISNULL (PM PRIMARYKEY) 

AND 

( 

DECODE (ADDBLOB, PM PREY ADDBLOB, 1,0) 2 ü 


JE 

DECODE (ADDID, FM_PREV_ADDID, 1, 0) = O 
JR 

DECODE(CODELVL,PM PREY CODELVL,1,0) = ü 
JE 

DECODE (NAME, PM_PREV_NAME, 1, 0) = 0 

JE 

DECODE(PKNAME,PM PREY PKNAME, 1, 0) = 0 
JE 

DECODE(TBNAME,PM PREY TBNAME, 1, 0) = 0 
JR 


DECODE (TYPE, PHM_PREY_ TYPE, 1, 0) = 0 
), TRUE, FALSE) 


图 18-21 代码 片段 


NewFlag: 判断 该 数据 是 否 为 狐 数 据 的 标识 字段 。 如 果 目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, iz Mapping 执行 插入 新 数据 的 操作 ; 否则 为 false， 不 做 插入 操作 。 
ITF ISHULL (PH PRIMARYKEY), TRUE, FALSE? 


当 第 一 次 执行 该 Mapping 时 ， 目 标 表 的 数据 如 图 18-22 所 示 。 


PE FEINAEIKET CODE | HANE (TENANE FKNANE ADDID ADDELOB TIFE CODELYL PE VERSION NUDEE 


图 18-22 ”目标 表 数 据 
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总 结 : 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 及 现 源 表 中 的 


日 数据 所 发 生 的 变化 , 将 变化 的 旧 数 据 作 为 
狐 的 一 条 数据 插入 到 目标 表 中 , 该 主键 值 不 
变 ， 并 赋予 新 的 代理 主键 值 。 如 果 源 表 中 发 
现 新 数据 ， 则 也 接 插 入 到 目标 表 中 。 其 中 版 
本 瑟 是 递增 记录 的 标识 , 版 本 写 最 大 的 是 最 
新 的 记录 。 


18.2.3 ”标记 位 方式 


源 表 : sre dxpcode. 
表 结 构 如 图 18-23 所 示 。 
数据 如 图 18-24 所 示 。 




















FERAE vanum Go) Y | hh 
pum AREER —— | — [| ———— 


图 18-23 src dxpcode 表 结 构 





[CODE | HANE  IBHANE FENANE [ADDID [ADDBLOE [TTFE CODELYL 
saoe RRA Ec EC po bp fp Eoo 
SEN -m RR p p Pr 


3046 期 刊 素材 BC eeo oo 
3049 RATU —— BK aE o 
3050 RATU ek — NK o 
3051 | 计划 与 总 结 zl YIO 
3001 | 实施 情况 seK [Sok —— 
300 pa [T PLAN |T PLAN - 
3002 | 情况 统计 IaKIJ RETI 
a003 Si JI II 
3004 ERLFBRÉE [DETAIL [DETAIL 
3005 | 月 报 —— 

3006 fit. ICE WJCQKT 


3007 通讯 录 
3010 设置 [BET 
anims] —— 
and 计划 
3015 情况 
3016 意见 [zg 
3017 | 追究。 
3016 活动 
3019 反馈 


302 进展 情况 ZYAT 
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TSAFEGE 
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图 18-24 src dxpcode 表 数 据 


目标 表 结 构 : newtarget2 。 
表 结 构 如 图 18-25 所 示 。 
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Name | Type Hullable Default [Storage [Comments 


mrmmans Weera N | — [| — (| —— 
Cn ——— QWMANMEGDE O (| | 
NANE waen | | [| 
THEE —— WANEREDY | 
FRE ———— UARGANEEOD | | o | 


i wO | O | 





K|18-25 newtarget2 表 结 构 


步骤 1: 在 绥 慢 变化 维 癌 导 中 ， 选 择 Slowly Changing Dimensions (REZE) MS, 
如 图 18-26 所 示 。 


| Wizards Getting Started... 
Debugger Slowly Changing Dimensions... 


K|18-26 ZISA HER] Si 





步骤 2: 选择 Type 2 Dimension 3X Zl, WB] 18-27 所 示 。 


Hew Mapping name: 


[n £ullhisterychanges 1 


Type 





(C Type 1 Dimension - keep most recent values in targı 


I Type 3 Dimension - keep the current and previous values in the 


< E+ m r—£ 7| 取消 | 帮助 | 
图 18-27 模式 问 导 


步骤 3: 选择 源 表 和 目标 表 ， 如 图 18-28 Pr. 
步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
需要 对 比 的 字段 ， 如 图 18-29 所 示 。 
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orcl:SRC DXPCODE Ba 





HEWTARGET2| 














图 18-28 源 表 和 目标 表 图 18-29 选择 器 
步骤 5: 生成 标准 的 全 历史 记录 型 标记 位 方式 绥 慢 变化 维 Mapping， 如 图 18-30 所 示 。 


re ea umm 
FE PE 让 3 JY) =. 
SEH íieneratek ENF RherProces 

sing InzertHe 
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(A a 


SRC_IHFCODE Í SH SRC 
üracle] E 


UFD Forcelnse HERTARGET? [O 
TIERES I rts raclel 
r E Ln l 
1 
2 
ae 


ar. "3 ] 
= — —e- A 4 X) = 
: E 1 
UFD ChanEedln EXP KerProcez JH 
serts sing InzsrtCh  : 
anged 


HEWIAREET21 Í 


Oracle] 


ume ! 

"n 人 

FIL UrdateCha UFD ChangedUp EXP FerProces —— 
ngedEeenrd date sine_ UndateCh D 
anged | 





HEWIAREET22 Í 


Oracle) 


图 18-30 ”映射 工作 区 


整个 Mapping 分 成 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 并 且 标 六 为 1、 将 旧 数 
据 标志 为 0， 如 图 18-31 所 示 。 

ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 tue， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目标 表 
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中 的 操作 ， 如 图 18-32 所 示 。 


SE Gounarstar EXF EoyProces 
ert sing insertie 


gg s be 


2 RO Lo I $9 SMC DEPCOD LKP Cefpata 
Oraclea) r 


mm $ »^ 
2d ~ A H 
- > (r^. I» 
EP betectchy PiL Tonertyew WD _Forcelnse NWETTARMSETI (O 
ages e — — 


一 8 


— 
c [M 2d 


FIL losertiChs UPD Chaagedin EIP KepProces 
ngeedAecorg seris Sing, InsertCh 
TL! 


pm $ »" 
Pè 号 
y A 2 
] + d 
AIL Lom DIN Y TELIUA EXF KeyT rocas 
CID EILIE! date Sing Updatech 


LX T 


NEWTARGET22 ! 


Oraele) 





图 18-31 映射 工作 区 的 数据 区 


[LIF (NOT (PM, PRIMARTKET) 
AND 
(PM CURRENT FLAG - 1) 
AND 
( 
DECODE (ADDBLOB,PM PREV ADDBLOB,1,0) = 0 
OR 
(ADDID,PM PREV  ADDID,1,0) = D 
OR 
(CODELVL,PM PREV CODELWL, 1,0) = 0 
OR 
(NAME,PM PREV NAME, 1,0) = 0 
OR 
DECODE (PKNAME, PM PREV PKNAME, 1,0) = 0 
OR 
(TENAME,PM PREV TBNAME,1,0) = O 
OR 
(TYPE,PM PREY TYPE, 1,0) = 0 
), TRUE, FALSE) 


图 18-32 代码 片段 
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NewFlag: 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 条目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, iZ Mapping 执行 插入 新 数据 的 操作 ;否则 为 false， 不 做 插入 操作 。 
IIFiISNHULL(ÜPM PRIMARYKEY), TRUE, FALSE] 


当 第 一 次 执行 该 Mapping 时 ， 上 有 目标 表 的 数据 如 图 18-33 所 示 。 


PN PEINAETEET CODE | HANE (TENANE PENANE [ADDID [ADDBLOB ITTPEICODELYL [PN CURRENT FLAG 


图 18-33 ”目标 表 数 据 
AE: 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 发 现 源 表 中 的 
日 数据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作为 狐 的 一 条 数据 插入 到 目标 表 中 ， 访 主键 值 不 变 ， 
并 赋予 新 的 代理 主键 值 。 如 果 源 表 中 发 现 新 数据 ， 则 直接 插入 到 目标 表 中 。 标 记 位 方式 是 其 


中 的 一 种 ， 主 要 包括 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 并 且 标 志 为 1、 将 旧 数 据 标 
志 为 0。 


18.2.4 时 间 惟 方式 


源 表 : sre dxpcode. 
表 结 构 如 图 18-34 所 示 。 
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FERAE Wann) Y | | ————— 
FERAS veeo o ooo 


图 18-34 src dxpcode 表 结 构 





数据 如 图 18-35 所 示 。 


CODE | HANE [TENANE [PEHANE ADDID ADDBLOB TIPE CODELVI. 
[33048 期 刊 素 村 Em Em Dn n r 1 
paar 期 刊 W w (p np B gà] -. 
33048 期 刊 素材 区 E [T [Y r 1 
33049 期 刊 QEK QK n n E 1 
ED NE NN NN NN 


Es M La IKTCQKTJ IKTCQKTJ f 1 1 
[33007 通讯 录 IGBTXL IGBTXL i n E 1 
gaunnRE — ET BT à np 2 30 o o 
[33011 索引 INDEX INDEX r [T E 1 
Baoa fiti — (mw å mp E Eg BP — 
gaus E w w D Eg BO 3j -. 


sox — ge e b Eg o d d —— 
mer w m p e d | —— 





图 18-35 src dxpcode 表 数 据 
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目标 表 结 构 : newtarget4. 
表 结 构 如 图 18-36 所 示 。 


局 RE o——— | —— | —— | 


图 18-36 newtarget4 表 结 构 





步骤 1: 在 绥 慢 变化 维 同 导 中 ， 选 择 Slowly Changing Dimensions (REZE) MS, 
如 图 18-37 所 示 。 


| Wizards Getting Started... 
Debugger Slowly Changing Dimensions... 


图 18-37 ZISA AE 





步骤 2: 选择 Type 2 Dimension 单 选 按钮 ， 如 图 18-38 所 示 。 


New Mapping name: 


SIE storychanges 2| 


Type 





Ü Type 1 Dimension - keep most recent values in targ 


(* Type 2 Dimension - keep a full history of changes in the 


Ü Type 3 Dimension - keep the current and previous values in the 


SF 取消 m | 


图 18-38 ”模式 向 导 
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A UR3: 选择 源 表 和 目标 表 ， 如 图 18-39 HR. 
步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
需要 对 比 的 字段 ， 如 图 18-40 所 示 。 


orcl:SRC DXPCODE Y 





NEWTARGET3 | 








图 18-39 MEM HERK 图 18-40 ”选择 器 
步骤 $: 生成 标准 的 全 历史 记录 型 时 间 戳 方式 绥 慢 变化 维 Mapping， 如 图 18-41 PZR. 


EXP kerProcesz 


sing InsertHe 


-— 350 [ 


SEC DEPCDODE [ SH SRC _ DAFCOD 
E 


Oracle) 


d = M ELE 
- X à 1 7) = A Ln 
E s | a E 
EXP DetectCha A FIL InsertHew UFD ForceInze HEWITARIET4 LO 

rts raclel 


"t 
pum 


m-— — — M ——. 
x 
kan 
* 


FIL InsertCha  UPD ChangedIn 
sing InsertCh ngedhRecord gerts 
anged 
E 


HEWTABECETÀd1 [| 
l! [us | i 


FIL_Up dat eCha WPD ChangedUp ER PO EalecTolat 1 
ngedhRecord date a 1 


JETTIAREET+42 [ 


Dracle) 





图 18-41 映射 工作 区 
整个 Mapping 分 成 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 、 将 该 历史 记录 的 结束 
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时 间 置 成 当前 系统 时 间 ， 如 图 18-42 所 示 。 


rE 


SEQ CenarateI — EXP LeyFrocet 
arā sing [nzertie 


| —— A | 


she DXPCODE ( SQ ZEC DXFCOD EX CatData 
[eT E Ox 


ETF DateciCha '' FIL IareriNew WO Forcelnte 
D TET | Berard 


"jud e SD? — rU Tm 


EXP i erfrocas | FIL.imzesriCha —— UPD Chasgedlm 
zxing Inger*Ch | nagedRacord Erie 
LETTE] 


E511 332 Ú 
Öraciaj 


WPD ChasgedUp ENF CalcToDat , 
date a 用 


PP 
WENTARBCETAZT d 
Bj TN) 





图 18-42 ”映射 工作 区 数据 区 


ChangeFlag: 判断 数据 是 否 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 tue， 该 Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目标 
表 中 的 操作 ， 如 图 18-43 所 示 。 


ILIF(NOT ISHULL (PM PRIMARYKET) 

AND 

( 

DECODE (ADDBLOB,PM PREY ADDBLOB, 1,0) = 0 
OR 

DECODE (ADDID,PM PREV ADDID,1,0) = 0 

OR 

DECODE (CODELVL,PM PREY CODELVL, 1,0) = 0 
OR 

DECODE (NAME, PM_PREV_NAME, 1, 0} = 0 
OR 

DECODE (PENAME,PM PREV PKNMAME, 1, D) 
OR 
DECODE(TBNAME,PM PREV TBNAME, 1, 0) = 
OR 

DECODE(TYPE,PM PREY TYPE, 1,0) = 0 
), TRUE, FALSE) 








II 
— 


| 
ce 


图 18-43 ”代码 片段 
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NewFlag: 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 条目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, iZ Mapping 执行 插入 新 数据 的 操作 ;否则 为 false， 不 做 插入 操作 。 


IIFiISNULLiPM PRIMARYKEY), TRUE, FALSE? 
当 第 一 次 执行 该 Mapping 时 ， 上 有 目标 表 的 数据 如 图 18-44 所 示 。 


PN PRINAEIKET|CODE | HANE (TENANE FENANE |ADDID ADUBLOB TTPEICODELYL | FE BEGIN DATE PN END DATE 
" — Hsu SEE Eu Ed D Eb (1 ao o porsa essa 
e poops Dr [HA D € E EmwrssiceH| ————— 
ke poogt era ETMIL D oo (à E  —— pür-s-Gpdésedl| 
ü5  Bsur]EWX e em i o G8 | Eres icedH| ————— 
ü* — pong mea mu i oo G | Eres assi 
vi  BswopEREUR Er EX D o ll | lialill 
vs soni MGRE re 


图 18-44 ”目标 表 数 据 


| | 








总 结 : 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 发 现 源 表 中 的 
日 数据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作为 狐 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 
并 赋予 新 的 代理 主键 值 。 如 来 源 表 中 发 现 狐 数据 ， 则 和 直接 插入 到 目标 表 中 。 时 间 惟 方式 是 其 
中 的 一 种 ， 主 要 包括 3 个 部 分 : 新 数据 的 插入 、 插 入 修改 后 的 数据 、 将 该 历史 记录 的 结束 时 
间 葡 成 当前 系统 时 间 。 














18.2.5 ”记录 最 新 记录 和 上 一 次 历史 


源 表 : src_dxpcode。 
表 结 构 如 图 18-45 所 示 。 
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FERAE Wann) Y | | ————— 
FERAS veeo o ooo 


图 18-45 src dxpcode 表 结 构 





数据 如 图 18-46 所 示 。 


目标 表 结 构 : 
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CODE | NANE (TENANE PENNE KDDID AUDBLOB [TTPE |CODELVL. 
soe Rm e E 0 p hl —— 
CL NN NEN CNN CNN NNNM RN CNN 


网 区 一 后 一 一 一 所 一 一 
Er Ll Roo 
soz [RIPSEE "as "las e —]— Àj 1 
mum m mop h o 
a ERN Ue m D D dB E 
Bauer eS  suescs Ted D — 0 — o aooo 





图 18-46 src dxpcode 表 数 据 


newtargetó 。 


表 结 构 如 图 18-47 所 示 。 


[ Name | Type  Wullable Default [Storage 
二 ET NERO Wo | —— | ——— 
TE Re | [| ——— 
pwE ——— wee! — | — [| ——— 
Empe way ED | | — (| ——— 
MI bd rr | | [d 


图 18-47 newtarget6 表 结 构 


iui 





步骤 1: 在 绥 慢 变化 维 同 导 中 ， 选 择 Slowly Changing Dimensions (REZE) MS, 
如 图 18-48 所 示 。 


| Wizards Getting Started... 
Debugger d Slowly Changing Dimensions... 





| 18-48 ”缓慢 变化 维 癌 导 
步骤 2: 选择 Type 3 Dimension 单 选 按钮 ， 如 图 18-49 所 示 。 


Hew Mapping name: 


[nke epcurprevaluez| 


Type 





C Type 1 Dimension - keep most recent values in targ 


C Type 2 Dimension - keep a full history of changes in the 


(* Type 3 Dimension - keep the current and previous values in the 


< E= m T-—Ée >| 取消 | am | 
图 18-49 ”模式 问 导 
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步骤 3: 选择 源 表 和 目标 表 ， 如 图 18-50 所 示 。 
步骤 4: Logical Key Fields 是 选择 唯一 确定 数据 的 关键 字段 ，Fields to compare for 是 选择 
需要 对 比 的 字段 ， 如 图 18-51 所 示 。 


orcl:SRC DXPCODE I 


NEWTARGETG 











K|18-50 WEM HERK 图 18-51 选择 器 


ZUR 5: 生成 标准 的 最 新 记录 和 上 一 次 历史 记录 的 缓慢 变化 维 Mapping, 如 图 18-52 所 示 。 


lay A E 

"aa! 3 xi il 

BIg am — Hue i (f ME m À 

| : -— | Ig il 
| : 


SEH beneratek 
ers 


: WE i d "s T 
La MN how L. "sl ES 
SRC DXPCODE ( ~ SQ SEC DXPCOD LEP GetData —— 
Draclel T RII 
o 1 nm 
ps | ji | 1 fu) Li = 
- [^ 1 
ne 1 lo 
EXP DetectCha ^ FIL InzertNew UFI ForceInse HEWIAREETE [O 
nEges ; Record rts raclel 
Ss ^ ! 


EM ua ~" ] 
FIL_Up dat eCha UFD ChangedUp EXP Effective À 
ngedEecord data Date InzsertCh A 

anged DL 


HEWIAREETEl1 | 


Draclel 





图 18-52 ”映射 工作 区 


整个 Mapping 分 成 两 个 部 分 : 新 数据 的 插入 、 旧 记录 修改 后 放 入 到 最 新 的 位 置 上， 同时 
将 原 记 录 移 到 旧 的 位 置 上 ， 如 图 18-53 所 示 。 

ChangeFlag: 判断 数据 是 盏 为 旧 数 据 的 标识 字段 。 将 所 有 的 比 对 字段 进行 对 比 和 比较 ， 
当 存 在 有 差异 的 字段 值 时 ， 则 其 值 为 true, iX Mapping 执行 将 旧 数 据 的 每 次 变化 插入 到 目标 
表 中 的 操作 ， 如 图 18-54 所 示 。 
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SEQ Casaratak EIF Ettaciine 
a75 Data_InzeriNa 
u 
p- P y 
m" : A. 2s / rl Du 
SEC DXPCODE | .2 BIFCOD 
Oracl) E 


AIR TCI 





-5 Js 
$ f= 
aLL EN A 1 WFD Forceinse 
nger Record ris racle) 
TEENS PR 
i E a | 
FIL UpdateCta WD Change Up EXF Effective 
ngadiecord ML Date [InsertCh 
anged 
: 一 
L1 16174903 | 
Üracle) 
图 18-53 ”映射 工作 区 的 数据 区 
NOT IPM PRIMARYKETY] 
ANT! 
í 
| :LADDBLOB, PM PREY ADDBLOB,1,05? = 0 
JR 
(ADDID,PM PREV ADDID,1,0) = 0 
JR 
IECODE (CODELVL, PM PREY CODELWL, 1,0) = ü 
JR. 
OK 


(NAME, PM PREV NAME, 1,0) = O 
OF 


(PKNAME,PM PREY_ PKMAME, 1,0) = O 
ÜR 


L(TENAME,PM PREV TBNAME,1,0) = D 
(TYPE,PM PREV TYPE,1,0) = D 
), TRUE, FALSE) 


图 18-54 ”代码 片段 
NewFlag: 判断 该 数据 是 否 为 新 数据 的 标识 字段 。 如 采 目 标 表 中 不 存在 该 数据 ， 则 其 值 为 
true, i% Mapping 执行 插入 新 数据 的 操作 ; 否则 为 false， 不 做 插入 操作 。 

(PM PRIMAKYKEY), TRUE, FALSE) 
位 置 上 。 


总 结 : 记录 最 新 记录 和 上 次 历史 记录 的 绥 慢 变化 维 是 不 太 第 见 的 一 种 方式 。 它 主要 包 
括 两 个 部 分 : 新 数据 的 插入 和 旧 记 录 修 改 后 放 入 到 最 新 的 位 置 上 ， 同 时 将 原 记录 移 到 旧 的 
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18.8 本章 小 结 


1) 在 现实 世界 中 ， 维 度 的 属性 会 随时 间 的 流逝 而 发 生 绥 慢 的 变化 。 将 发 生变 化 的 维度 称 
作 “ 组 慢 变化 维 ” 它 是 一 种 ETL 对 数据 仓库 维度 表 的 更 新 技术 。 

2) 在 数据 仓库 中 ， 事 实 表 的 设计 通常 包含 多 个 代理 主键 ,周围 环绕 看 多 个 维 表 ， 当 维 表 
的 数据 发 生变 化 时 ， 数 据 仓 库 需 要 立刻 发 现 这 种 维度 的 变化 。 

3) 绥 慢 变化 维 的 实现 方式 : 采用 和 履 盖 方式 、 全 历史 记录 方式 、 标 记 位 方式 、 时 间 蕉 方式 、 
记录 最 新 记录 和 上 一 次 历史 的 方式 。 

4) 复 症 方式 是 绥 慢 变化 维 中 相对 简单 的 一 种 方法 。 其 特点 是 保证 数据 仓库 中 的 数据 始终 
征 最 新 的 ， 不 你 留 历史 数据 。 如 果 发 现 新 数据 ， 则 将 痢 数 据 加 载 到 目标 大 中 。 如 末 数 据 发 生 
改变 ， 则 执行 更 新 操作 。 

5) 全 历史 记录 方式 是 绥 慢 变化 维 中 功能 较为 强大 的 一 种 方式 。 它 可 以 友 现 源 表 中 的 旧 数 
据 所 发 生 的 变化 ， 将 变化 的 旧 数 据 作为 独 的 一 条 数据 插入 到 目标 表 中 ， 该 主键 值 不 变 ， 并 赋 
予 新 的 代理 主键 值 。 

6) 记录 最 独 记 录 和 上 次 历史 记录 的 绥 慢 变化 维 是 不 太 剃 见 的 一 种 方式 。 它 主要 包括 两 个 
部 分 : 新 数据 的 插入 和 旧 记 录 修 改 后 放 入 到 最 新 的 位 置 上 ， 同 时 将 原 记录 移 到 旧 的 位 置 上 。 
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第 19 章 Cognos 安装 与 快速 入 门 


本 章 目 标 

在 学 习 Cognos 工具 的 使 用 之 后 ， 本 章 将 讲解 Cognos 的 安 疙 与 快速 入 门 的 实例 。Cognos 
HE ELA) AS s d. Framework 建 模 工具 安装 、Transformer IRRI 3 部 分 ， 扩 
展 的 RNT PowerPlay 安装 等 。 

学 习 本 章 后 ， 您 将 掌握 : 

€ Cognos 的 安装 过 程 。 

€ Framework 建 模 工具 的 使 用 。 

€ Transformer WY 方 体 多 维 建 模 工 具 的 使 用 。 

e 使 用 Report Studio 开发 报表 。 

@ 使 用 Analysis Studio 开发 多 维 报表 。 














19.1 Cognos 8 安装 


Cognos 8 的 安 状 分 为 4 个 部 分 。 
€ Cognos IKAR. 

€ Cognos Framework 的 安装 。 
€ Cognos Transformer 的 安装 。 
€ Cognos ik zi Gm zx. 


19.1.1 Cognos 服 务 器 安装 
首先 进入 Cognos 安装 界面 ， 选 择 安 装 语 言 ， 选 择 English 版 本 ， 如 图 19-1 Pr. 


Y Cognos 8 Business Intelligence Server 








4 o - Welcome to the Installation Wizard 


The Installation Wizard helps you install Cognos products or add 
components to an existing installation. 


For detailed information, view the Installation Guide and 
Readme. 


Installation Location Installation Language Selection 


Component Selection 


Select the language you want to use to run this install. 
Shortcut Folder £M 


Deutsch (German) 
English (Default) 


You can select 'Back at any time to change your selections. 


Please select 'Next' to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 





NS 


图 19-1 Cognos 安装 界面 
选择 安装 语言 后 ， 单 击 Next 按钮 ， 如 图 19-2 所 示 。 
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©- Cognos 8 Business Intelligence Server 


License Ágreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Welcome Cognos, the end-user license agreement below applies to you. 
þ License By continuing with this installation, you confirm your acceptance of 
. ! the terms and conditions. If you do not agree with them, stop the 
Installation Location installation and return the entire package to your authorized Cognos 


Component Selection representative within two weeks for a full refund. 
Shortcut Folder 
Summary CONTENTS: This software product ("Software") consists of trade A 


secrets and intellectual property belonging to, or licensed by, 
Cognos Incorporated, residing on this medium ("Medium") and 
Finish related user documentation ("Related Documentation"). 


Progress 


TITLE: Ownership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. a5 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


C I do not accept 





< Back Cancel | 





19-2 Cognos 安装 协议 问 导 
然后 单 击 Next 按钮 ， 进 入 本 地 安装 设置 页 和 ， 选 择 要 安装 的 路 径 ， 如 图 19-3 Wr. 


¥: Cognos 8 Business Intelligence Server 


Installation Location 


Installation Directory: 


Welcome C:\Program Files*cognoshc8 vl | 


License 
p Installation Location 
| Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 


Available 


= C:) 21.55 GB 834.94 MB 
=] (p:) SOFTWARE 1T.02 GB .00 Bytes 








< Back Cancel | 
19-3 Cognos 安装 路 径 向 导 


选择 好 安 北 路 径 后 ， 单 击 Next 按钮 ， 进 入 Cognos 组 件 安装 选择 癌 导 页 面 ， 如 图 19-4 所 示 。 





©- Cognos 8 Business Intelligence Server 


Component Selection 
Which components do you want to install or upgrade? 


Welcome 
license | X [Cognos 8 Business Intelligence Server 
Installation Location V v| Application Tier Components 


p Component Selection y | Gateway 
Shortcut Folder sZ Content Manager 


Ad iC onos Content Database 
Summary 


Progress 
Finish 





- Description -Disk Space 


Cognos Content Database Total required: 


848.58 MB 











< Back Cancel | 





19-4 Cognos 安装 组 件 问 导 


单 击 Next 按钮 ， 进 入 快捷 方式 选择 页 面 ， 鸭 认 系 统 选择 即 可 ， 如 图 19-5 所 示 。 
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W:Cognos 8 Business Intelligence Server 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


Welcome To put these shortcuts in a different folder, select an existing 


ETT TE folder from the list, or enter a new folder name. 


Installation Location Program folder: 


Component Selection 
[Cognos 8 (1) 


p Shortcut Folder 


nid Existing folders: 

1 BEA Products 

Finish Borland StarTeam 
Cognos 8 
Cognos 8 (Framework) 
Cognos 8 (Transformer) 


Progress 


~ nn mi ODN h 


V Make the shortcuts visible to all users 


< Back Cancel | 
图 19-5 Cognos 安装 快捷 方式 癌 导 


单 击 Next 按钮， 系统 显示 安装 的 信息 ， 如 末 和 需要 修改 ， 和 直接 单 击 Back 按钮 返回 操作 ， 
如 图 19-6 所 示 。 





-Cognos 8 Business Intelligence Server 


Installation Summary 


The Cognos Installation Wizard is ready to install the components you 








selected. 
Welcome If you want to review or change any settings, select "Back . 
lene If you are satisfied with the settings, select 'Next'. 
Installation Location Current Settings: 
Component Selection 
Selected Components: ^ 
Shortcut Folder Cognos 8 Business Intelligence Server = 
p Summary Application Tier Components 
Progress Gateway 
Content Manager 
Finish Cognos Content Database = 


Local disk space information: 


Drive: Available: Required Estimate: 
Ben 21.4T GB 915.03 MB 

w 
< 山 > 








< Back Cancel | 





图 19-6 Cognos 安装 信息 提示 


确认 无 误 后 ， 单 击 Next 按钮 ， 开 始 安装 ， 如 图 19-7 Bp. 


¥- Cognos 8 Business Intelligence Server 


Installation Progress 


Welcome 
License 
Installation Location 

Component Selection B 
Shortcut Folder 
Summary 


jp emisi 25 of total 286 components installed 


Finish 一 一 一 








19-7 Cognos 安装 进程 界面 


Cognos 服务 器 安装 完成 后 ， 可 以 选择 查看 日 志 或 者 局 动 Cognos 配置 工具 ， 如 图 19-8 
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所 示 。 


$ Cognos 8 Business Intelligence Server 


The Cognos Installation Wizard is complete. 


All selected components were transferred successfully. 
Welcome 


License 
Installation Location 
View the transfer log. 


Component Selection 
Shortcut Folder 


Summary | View the summary-error log. 


Please select ‘Finish to close the Wizard. 


[ View Cognos Readme 
[| Start Cognos Configuration 





图 19-8 Cognos %2% JV] ZI 
FIE, Cognos IRE ds zer RV. 
19.1.2 Cognos Framework Ze € 


首先 进入 Framework 安装 界面 ， 如 图 19-9 所 示 。 


W*-Cognos 8 Business Intelligence Modeling 





Welcome to the Installation Wizard 


The Installation Wizard helps you install Cognos products or add 
components to an existing installation. 


p Welcome For detailed information, view the Installation Guide and 
License Readme. 
Installation Location Installation Language Selection 
Component Selection 
Shortcut Folder 
Summary 


Select the language you want to use to run this install. 
Deutsch (German) 

English ^ (Default) 

n Francais (French) 

Finish 日 本 话 a 


Progress 


You can select 'Back at any time to change your selections. 


Please select 'Next' to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 


cuca | 


图 19-9 Framework 安装 界面 


选择 安装 语言 ， 单 击 Next 按钮 后 ， 进 入 到 条 坎 页 面 ， 如 图 19-10 Fr. 


Æ Cognos 8 Business Intelligence Modeling 





License Agreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Welcome Cognos, the end-user license agreement below applies to you. 


j License By continuing with this installation, you confirm your acceptance of 
Installation Locati the terms and conditions. If you do not agree with them, stop the 
ns ALON- OCASEON installation and return the entire package to your authorized Cognos 

Component Selection representative within two weeks for a full refund. 

Shortcut Folder 


Summary CONTENTS: This software product ("Software") consists of trade A 
secrets and intellectual property belonging to, or licensed by, E 

Cognos Incorporated, residing on this medium ("Medium") and 

Finish related user documentation ("Related Documentation"). 


Progress 


TITLE: Üwnership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. wj 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


C I do not accept 


< Back Cancel | 





图 19-10 Framework 安装 协议 问 导 
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选择 Iaccept FL dZ4Hl, Hri Next tth, HA gi HRAM, AE] 19-11 所 示 。 


¥- Cognos 8 Business Intelligence Modeling 


Installation Location 





Installation Directory: 


Welcome C:\Program Files*cognosWFramework e | 


License 

p Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 





Available Drive Type ^ 
= (c) 20.62 GB 145.73 MB Loc 三 
Œ] (D:) SOFTWARE 17.02 GB —— .00 Bytes Local 


I^ | 
| 





< Back Cancel | 


19-11 Framework 安装 路 径 向 导 











选择 要 安装 有 的 目录 后 ， 早 击 Next 投 钮 ， 进 入 安 逆 组件 选择 页 面 ， 如 图 19-12 所 示 。 


We Cognos 8 Business Intelligence Modeling 


Component Selection 
Which components do you want to install or upgrade? 


Welcome 
Li cense v v iC onos 8 Business Intelligence Modeling 


Installation Location y 7] Framework Manager 
p Component Selection y 7] Map Manager 
Shortcut Folder 
Summary 
Progress 


Finish 


Description ] Disk Space- 
Installs Cognos 8 Business Intelligence 


Modeling component (s) on one computer UOCE sonio 


563. 54 MB 








< Back Cancel | 








图 19-12 Framework 安装 组 件 问 导 


默认 都 选择 后 ， 单 击 Next 按钮 ， 进 入 到 快捷 方式 安装 页 面 ， 如 图 19-13 所 示 。 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


Welcome To put these shortcuts in a different folder, select an existing 


licenza folder from the list, or enter a new folder name. 


Installation Location Program folder: 


Component Selection 
) Shortcut Folder [Cognos 8 (Framework)| 


S 
amd Existing folders: 
Progress 


Finish 


Br 
谷歌 金山 词霸 合作 版 
管理 工具 

刻录 


[€ Make the shortcuts visible to all users 





< Back Cancel | 





图 19-13 Framework 安装 快捷 方式 同 导 
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这 里 ， 最 好 不 要 和 Cognos 安装 日 录放 在 一 起 ， 填 好 后 单 击 Next 按钮 ， 
装 信 息 ， 如 图 19-14 所 示 。 


-Cognos 8 Business Intelligence Modeling 


Installation Summary 


The Cognos Installation Wizard is ready to install the components you 
selected. 

Welcome If you want to review or change any settings, select 'Back'. 

licenze If you are satisfied with the settings, select 'Next'. 


Installation Location Current Settings: 
Component Selection 
Selected Components: 
Shortcut Folder Cognos 8 Business Intelligence Modeling 


p Summary Framework Manager 


Progress Map Manager 


Finish 
Local disk space information: 


Available: Required Estimate: 
20.62 GB 630. 99 MB 


Dialog Entry Information: 
[Installation Location] 


< 


< Back Cancel | 





K] 19-14 Framework 安装 信息 界面 


HAIR. rh Next fkth, Minz, WB 19-15 Wr. 


¥:- Cognos 8 Business Intelligence Modeling 


Installation Progress 


Welcome 


License va 
Installation Location 

Component Selection B 
Shortcut Folder 


S 
mud 8 of total 161 components installed 


p Progress 
Finish 





图 19-15 Framework 安装 开始 界面 
该 过 程 大 概 会 持续 几 分 钟 ， 请 耐心 等 待 ， 结 果 如 图 19-16 所 示 。 


We Cognos 8 Business Intelligence Modeling 


The Cognos Installation Wizard is complete. 

All selected components were transferred successfully. 
Welcome 
License 


Installation Location 


Component Selection View | View the transfer log. 


Shortcut Folder 


Summary View | View the summary-error log. 


Progress 
p Finish 


Please select 'Finish to close the Wizard. 


[ View Cognos Readme 
[| Start Cognos Configuration 





图 19-16 Framework 安装 成 功 界面 
出 现 这 个 界面 ， 说 明 Framework 已 经 成 功 安 装 ， 单 击 Finish 按钮 结束 安装 。 
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19.1.3 Cognos Transformer 安 装 
首先 进入 Transformer 安装 界面 ， 如 图 19-17 所 示 。 


Cognos 8 Business Intelligence Transformer 


Welcome to the Installation Wizard 


The Installation Wizard helps you install Cognos products or add 
components to an existing installation. 


p Welcome For detailed information, view the Installation Guide and 
License A 2 Readme. 
Installation Location Installation Language Selection 
Component Selection t 
Select the language you want to use to run this install. 
Shortcut Folder 
Deutsch (German) 


English ^ (Default) 
Frangais (French) 
日 本 语 (Japanese) 


Summary 
Progress 
Finish 


You can select 'Back at any time to change your selections. 


Please select 'Next' to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 








图 19-17 Transformer 安装 界面 





XETEZCRiB RH. "uh Next 控 钮 后 ， 进 入 到 条 球 页 面 ， 如 图 19-18 所 示 。 


Cognos 8 Business Intelligence Transformer 


License Ágreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Cognos, the end-user license agreement below applies to you. 

þ License By continuing with this installation, you confirm your acceptance of 


Installation Locati the terms and conditions. If you do not agree with them, stop the 
ns arron aceon installation and return the entire package to your authorized Cognos 
Component Selection representative within two weeks for a full refund. 


Shortcut Folder 


Summary CONTENTS: This software product ("Software") consists of trade A 

secrets and intellectual property belonging to, or licensed by, (m 
Progress Cognos Incorporated, residing on this medium ("Medium") and 
Finish related user documentation ("Related Documentation"). 


Welcome 


TITLE: Ownership of the Software and any related trademark, 

trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. M 
To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


C I do not accept @ T accept 


< Back Cancel | 





图 19-18 Transformer 安装 协议 问 导 


选择 I accept 单 选 按钮 ， 单 击 Next 按钮 ， 进 入 安装 目录 选择 页 面 ， 如 图 19-19 Pr. 


Æ Cognos 8 Business Intelligence TIransformer 


Installation Location 





Installation Directory: 


Welcome [C:\Program Files\coenos\Transformer » | 


License 

p Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 


dimos Available Drive Type 





j 21.02 GB 430.22 MB Local 
:) SOFTWARE 17.02 GB .00 Bytes Local 


|< 


< Back Cancel | 


图 19-19 Transformer 安装 路 径 向 导 
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ARERR HKA fat Next 2L, BEA RFR ENR, WME 19-20 所 示 。 


-Cognos 8 Business Intelligence Iransformer 


Welcome 

License 

Installation Location 
p Component Selection 

Shortcut Folder 

Summary 

Progress 

Finish 





Component Selection 


Which components do you want to install or upgrade? 


MAd iC onos 8 Business Intelligence Transformer 
y »|Cognos 8 Transformer 
wy v|Series T IQD Bridge 


Description 
Installs Cognos 8 Transformer 
component Ís) on one computer 


Disk Space 


Total required: 
430.22 MB 


€ Back Cancel | 





图 19-20 Transformer 安装 组 件 癌 导 


默认 都 选择 后 ， 单 击 Next 按钮 ， 进 入 到 快捷 方式 安装 页 面 ， 如 图 19-21 所 示 。 


-Cognos 8 Business Intelligence Transformer 


Welcome 

License 

Installation Location 

Component Selection 
p Shortcut Folder 

Summary 

Progress 

Finish 


图 19-21 





这 里 ， 最 好 不 要 和 Cognos 安装 目录 放 在 一 起 ,然后 单 击 Next 按钮， 


如 图 19-22 所 示 。 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


To put these shortcuts in a different folder, select ar existing 
folder from the list, or enter a new folder name. 


Program folder: 


[Cognos 8 (Transformer) 


Existing folders: 


ESET 

GIGABYTE 

HyperSnap 8.82.01 免 注 册 肖 化 版 
Informatica PowerCenter 8.1.1 
Microsoft Üffice 

Oracle - ÜraDbiOg homel 
SoTower Studio 


IUD m1 


V Make the shortcuts visible to all users 








€ Back Cancel | 


Transformer 安装 快捷 方式 癌 导 


© Cognos 8 Business Intelligence Iransformer 


Welcome 
License 
Installation Location 
Component Selection 
Shortcut Folder 
p Summary 
Progress 
Finish 





Installation Summary 


The Cognos Installation Wizard is ready to install the components you 
selected. 

If you want to review or change any settings, select Back. 

If you are satisfied with the settings, select 'Next'. 


Current Settings: 


Selected Components: 
Cognos 8 Business Intelligence Transformer 
Cognos 8 Transformer 
Series T IQD Bridge 


Local disk space information: 


Available: 
20.90 GB 


Required Estimate: 
497.67 MB 


Dialog Entry Information: 
[Installation Location] 


《 > 


< Back Cancel | 


图 19-22 Transformer 安装 信息 界面 


人 确认 无 误 后 ， 单 击 Next ixt, MRR. 
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RREI RRIA 


最 后 单 击 Finish 按钮 结束 安装 ， 如 图 19-23 所 示 。 


Y% Cognos 8 Business Intelligence Iransformer 


Finish 





The Cognos Installation Wizard is complete. 


All selected components were transferred successfully. 
Welcome 


License 

Installation Location 
Component Selection 
Shortcut Folder 


View | View the transfer log. 


Summary View | View the summary-error log. 
Progress 
p Finish 


Please select 'Finish! to close the Wizard. 


[| View Cognos Readme 
[ Start Cognos Configuration 








图 19-23 Transformer 安装 成 功 界 面 


19.1.4 ”Cognos 语言 包 安 装 
首先 选择 安装 语言 ， 如 图 19-24 所 示 。 


Cognos 8 Business Intelligence Supplementary Languages 

一 一 5 RE 7 i 

ue 3x Welcome to the Installation Wizard 
* ^ The Installation Wizard helps you install Cognos products or add 


hd 


p Welcome 
License 
Installation Location 


components to an existing installation. 


For detailed information, view the Installation Guide and 


Readme. 
Installation Language Selection 


Component Selection 
Shortcut Folder 


Summary 


Select the language you want to use to run this install. 
Deutsch 
English 
Francais 
日 本 语 


(German) 
(Default) 
(French) 
(Tapanese) 


Progress 
Finish 


You can select 'Back at any time to change your selections. 


Please select 'Next/' to start installing. 


Copyright (C) 2007 Cognos Incorporated. All rights reserved. 





Back 


Cancel | 


WB ARI 





图 19-24 
接受 安装 协议 ， 如 图 19-25 所 示 。 


F- Cognos 8 Business Intelligence Supplementary Languages 


Welcome 

p License 
Installation Location 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


License Agreement 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superseding written agreement with 
Cognos, the end-user license agreement below applies to you. 


By continuing with this installation, you confirm your acceptance of 
the terms and conditions. If you do not agree with them, stop the 
installation and return the entire package to your authorized Cognos 
representative within two weeks for a full refund. 


CONTENTS: This software product ("Software") consists of trade A 
secrets and intellectual property belonging to, or licensed by, E 
Cognos Incorporated, residing on this medium ("Medium") and 

related user documentation ("Related Documentation"). 


TITLE: Üwnership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 
property of Cognos and its licensors. 的 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 
agreement? 


C I do not accept 








选择 Cognos 的 安装 目录 ， 如 图 19-26 PTR. 


$ Cognos 8 Business Intelligence Supplementary Languages 


Installation Location 


Installation Directory: 


Welcome D:Xcognosse8 m | 


License 

p Installation Location 
Cognos Running Services 
Component Selection 
Shortcut Folder 
Summary 
Progress 
Finish 


Local disk space information: 


[Drive | Available Drive Type ^ 


22.11 GB .00 Bytes Local EC 
SOFTWARE 15.44 GB 343.93 MB Local 


| e 


v 





< Back Cancel | 





19-26 语言 包 安 装 路 径 问 导 


WA m AU, lul 19-27 Br. 


F- Cognos 8 Business Intelligence Supplementary Languages 





Installation Location 


Installation Directory: 


Welcome D:Xcognos*c8 二 


License 
p Installation Location 
Cognos Running Services 
Component Se 
Shortcut Fo. Installation Location 


S 
TARY This installation will replace existing files. 


Progress Select 'Yes' to automatically create a backup of all files that are replaced. 
Finish 


Available Drive Type ^ 
=] (C:) 22.71 GB .00 Bytes Local — 
E] (D:) SOFTWARE 15.44 GB 343. 93 MB Local 





< Back | Jext > | Cancel | 











19-27. 语言 包 安装 路 径 提 示 问 时 


系统 提示 停止 Cognos 正在 运行 的 服务 ， 如 图 19-28 所 示 。 


W Cognos 8 Business Intelligence Supplementary Languages 














Cognos Running Services 


The following Services are running, they must be stopped. 
Welcome 
License 
Installation Location 


p Cognos Running Services Running Services: 





Component Selection 
Shortcut Folder Cognos Content Database 


Summary 
Progress 
Finish 


Click 'Next' to stop services. 





< Back Cancel | 














19-28 语言 包 安 装 关 闭 程 序 提示 界面 
了 20 


选择 安装 组 件 ， 如 图 19-29 Bp. 


Æ- Cognos 8 Business Intelligence Supplementary Languages 


Welcome 

License 

Installation Location 

Cognos Running Services 
p Component Selection 

Shortcut Folder 

Summary 

Progress 

Finish 


Component Selection 


Which components do you want to install or upgrade? 


Finnish 
Italian 
Portuguese 


Russian 


Simplified Chinese 


Spanish 
X 7|Swedish 
Bx | Additional Language Fonts 





Description -Disk Space 


Supplementary Language Pack for 


5 xd . Total required: 
Simplified Chinese 78.36 MB 














€ Back Cancel | 








19-29 语言 包 安 装 组 件 癌 导 


选择 快捷 键 安装 路 径 ， 如 图 19-30 所 示 。 


© Cognos 8 Business Intelligence Supplementary Languages 


Welcome 
License 
Installation Location 
Cognos Running Services 
Component Selection 

p Shortcut Folder 
Summary 
Progress 
Finish 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


To put these shortcuts in a different folder, select an existing 
folder from the list, or enter a new folder name. 


Program folder: 


[Cognos 8 


Existing folders: 


BEA Products 
Borland StarTeam 


z 
Cognos Framework 
Cognos PowerPlay 
Cognos Transformer 


[v Make the shortcuts visible to all users 





€ Back Cancel | 








19-30. AORE IRA 


AJ 





系统 显示 安装 信息 ， 如 图 19-31 所 示 。 


Æ Cognos 8 Business Intelligence Supplementary Languages 


Welcome 
License 
Installation Location 
Cognos Running Services 
Component Selection 
Shortcut Folder 

p Summary 
Progress 
Finish 


Installation Summary 


The Cognos Installation Wizard is ready to install the components 
selected. 

If you want to review or change any settings, select “Back' . 

If you are satisfied with the settings, select 'Next'. 


Current Settings: 
Selected Components: 


Cognos 8 Business Intelligence Supplementary Languages 
Simplified Chinese 


Local disk space information: 


Available: Required Estimate: 
22.71 GB T2.T3 MB 
15.44 GB T8.33 MB 


Dialog Entry Information: 
[Installation Location] 


《 | a 





< Back Cancel | 














19-31 语言 包 安 装 信 息 界 面 
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接 下 来 系统 开始 安装 ， 如 图 19-32 所 示 。 


W Cognos 8 Business Intelligence Supplementary Languages 


Installation Progress 


Welcome 


License w 
Installation Location D 

Cognos Running Services 

Component Selection 

Shortcut Folder . 

B of total 19 components installed 
Summary 


p Progress 


Finish eu 

















19-32 ”语言 包 安 装 开始 界面 
安装 结束 后 ， 如 图 19-33 所 示 。 


We Cognos 8 Business Intelligence Supplementary Languages 
Finish 


The Cognos Installation Wizard is complete. 
Wl All selected components were transferred successfully. 
elcome 


License 
Installation Location 


Cognos Running Services View | View the transfer log. 


Component Selection 


Shortcut Folder View | View the summary-error log. 


Summary 
Progress 
p Finish 


Please select Finish’ to close the Wizard. 


[ View Cognos Readme 


Backup Location: 
D:*eognos*c8*uninstallhbackupilp 20110508 1452*^ 


图 19-33 ”语言 包 安 装 成 功 界面 
Cognos 语言 包 安 装 完 之 后 ， 需 要 进行 配置 后 才能 生效 。 


接 下 来 ， 介 绍 Cognos 的 语言 包 配 置 步 又。 首先 ， 打 开 Cognos Configuration 工具 ， 选 择 
3i€F- Action 一 Edit Global Configuration， 如 图 19-34 所 示 。 





























| [ 90e wet prapertes vto tuntoa aree fr tha conpanents avtalad on he ofi npe, 
| Mtr ya eta ora o more Cognos t components on your compute , you must mieu btt sai p m viter ^ 
pete ee re eater vn apre aac dequo ia bó trge Cognos 8 Component afr 


[tmo udi than, cid pe ons 9 tre ts À a torterty sees om vii imd tea Po vem prostrati, tv Pon wt Fr ue um Corm 
| V service on the bocal compute. After YOU mue the Ganges save your corfigur soon and ben rums ode iiti sent Vm dre i 
fO CONDE 








19-34 Cognos Configuration 配置 界面 


3268 


然后 在 Product Locales 选项 卡 中 添加 zh-cn "Pc, a 19-35 所 示 。 


slobal Configuration 


Product Locale Mappings | ^ Content Locale Mappings | Currencies | Fonts | General 
Product Locales | Content Locales 


Supported Locale Description 


Remove 


Cancel — | 





19-35 添加 zh-cn 中 文 规则 


在 General 选项 卡 中 ， 将 Server locale 的 值 设 为 zh-cn， 如 图 19-36 所 示 。 


Global Configuration 


Product Locales Content Lacales 
Product Locale Mappings | Content Locale Mappings | Currencies | Fonts X General 


Server locale EN 

Server time zone Gu (aMT-- 08:00) Asia, Shanghai 
** Default font Andale WT 

Email Encoding LITF-8 

Archive Location File System Fogok 


Reset to Default Test 





19-36 ”中 文 设置 
WEG. SUN Cognos 服务 。 


然后 进入 Cognos Connection， 选 择 My Preferences 选项 ， 进 入 “首选 项 ”设置 界面 ， 如 
图 19-37 所 示 。 


-nh ?7 


My Wakbch Items 


: My Preferences | 
: P : 国 
LET Mv Activities and Schedules Eh. ** p ars 


Entries: - © alla 
19-37. "HI" wA 
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安装 设置 如 下 ， 进 行 语言 的 设置 ， 然 后 保存 即 可 ， 如 图 19-38 所 示 。 


Set preferences 


General Personal Portal Tabs 


specify your settings, 


Number of entries in list view: Report format: 


Hmm 司 


Separators in list view: Automatic refresh rate in seconds: 


| No separator k | 














Style: 


Corporate M| Preview 


Show the Welcome page at startup 


Show a summary of the run options 


Portal 


Default view: 
© List 
© Details 


Number of columns in details view: 


3 columns ** 


Regional options 


Product language: Content language: 


Chinese (China) ™ Chinese (China) v 


Time zone: 








19-38 Context Language 设置 界面 


19.1.5 Cognos PowerPlay Z X€ 


双击 安装 PowerPlay 的 程序 ,选择 Install Cognos 8 Business Intelligence OLAP Modeling 8.1 
Windows 选项 ， 如 图 19-39 所 示 。 


É* Cognos 8 Business Intelligence OLAP Nodeling 8... [X] 


COGNOS 


View the Install Documentation and Readme 
Install Support Files 
Install Cognos & Business Intelligence OLAF Modeling 5.1 Windd 


Visit Cognos on the Web 





Copyright (LJ) 2005 Cognos Incorporated. All rights reserved. 
For details, click 1g 


19-39 PowerPlay 安装 界面 


随后 弹出 欢迎 界面 ， 如 图 19-40 PTR. 
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和 输入 用 户 信息 ， 


p Welcome 


License 

User Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 

Progress 
Configuration 

Finish 


F Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


components to an existing installation. 


The installation process consists of: 


(1) transferring components to the computer 
(2) configuring and applying component properties 


You can select 'Back at any time to change your selections. 


Please select 'Next' to start installing. 








19-40 PowerPlay 欢迎 界面 


接受 安 闭 协议 ， 如 图 19-41 所 示 。 


Welcome 


p License 


User Information 
Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 

Progress 

Configuration 

Finish 


License Ágreement 


F Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


This Cognos software product is subject to a license agreement. 
Unless you have entered into a superceding written agreement with 
Cognos, the end-user license agreement below applies to you. 


By continuing with this installation, you confirm your acceptance of 
the terms and conditions. If you do not agree with them, stop the 
installation and return the entire package to your authorized Cognos 
representative within two weeks for a full refund. 


CONTENTS: This software product ("Software") consists of trade 
secrets and intellectual property belonging to, or licensed by, 
Cognos Incorporated, residing on this medium ("Medium") and 
related user documentation ("Related Documentation"). 


TITLE: JQÜwnership of the Software and any related trademark, 
trade secret or copyright are, and will remain, the exclusive 


property of Cognos and its licensors. 


To install this product, you must accept the license agreement. If 
you choose not to accept, the installation will stop. 


Do you accept all the terms and conditions of the preceding license 


agreement? 


C I do not accept 





19-41 


Welcome 


License 


p User Information 


Installation Type 
Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 

Progress 

Configuration 

Finish 


如 图 19-42 Brzn. 


User Information 


< Back Cancel | 





PowerPlay 安装 协议 问 导 


内 Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Please enter your name and company name in the appropriate boxes. 


Hame: 


[Liuguofeng 


Company: 


[Cognos 





T teca | 








19-42 PowerPlay 用 户 信 息 问 导 


选择 安装 类 型 ， 这 里 选择 日 定义 安 六 ， 如 图 19-43 所 示 。 
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F Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Installation Type 
Which type of installation do you want to perform? 


Welcome 


Licnse C Default 


User Information Enables you to install the default selection of components. This 


p Installation Type option uses default settings to automatically configure each 
Component Selection component . 


Character Set Selection fej : 


Installation Location Enables you to select the components that you want to install. 
Shortcut Folder This option also enables you to customize the configuration of 
each component. 

Summary 

Progress Minimal 


Configuration Installs only the components required to run the product without 
Finish security administration, modeling, or portal functionality. 





< Back Cancel | 








选择 安装 组 件 ， 如 图 19-44 所 示 。 


F- Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Component Selection 
Which components do you want to install or upgrade? 


Welcome 
Licènse PowerPlay for Windows [Installed] 


PowerPlay for Excel [Installed] 

PowerPlay Transformer Client for UNIX [Installed] 
Access Manager Administration [Installed] 

PowerPlay Transformer Edition Tools [Installed] 
PowerPlay Transformer Edition Quick Tours [Installed] 
PowerPlay Transformer Edition Samples [Installed] 
Default Font [Installed] 


Vser Information 
Installation Type 

p Component Selection 
Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 
Progress 
Configuration 
Finish 





Description Disk Space 
Default Font Registration Total required: 


344. 1T MB 








< Back Cancel | 








图 19-44 PowerPlay 安装 组 件 问 导 


接 下 来 选择 安装 语言 ， 如 图 19-45 所 示 。 


A EEE 8 Business Intelligence OLAP Nodeling 8.1 Windows 
- N EEE 
Character Set Selection 
e x A 


~ This product can support one of several character sets. 
Select the set of locales that you require. 


Welcome 





r Locale 


T Inf ti Locales for English, "French, "German, utch, "Spanish, "Swedish 
Ser Hncormecrom (* Ttalian, Finnish, Portuguese and other Western European i 
Installation Type l 


Component Selection 

p Character Set Selection 
Installation Location 
Shortcut Folder 
Summary 


License 


C Locales for other languages. 


Progress 
Configuration 
Finish 














< Back Cancel | 





图 19-45 PowerPlay 本 地 化 问 导 


接着 选择 安装 路 径 ， 如 图 19-46 Bp. 
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WS Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Installation Location 


I] 
Aa 
= 
t 


Cognos Components: 


D: *cognosMPowerPlay 


国 


Welcome 
License (Note: Future Cognos components of the same cer4 rendition will be 
User Information installed in this directory. ) 
Installation Type Documentation: 
Component Selection AcognosXPowerPlayNdocumentation 
Character Set Selection . : 
p Installation Location 
Shortcut Folder 
Summary 
Progress 
Configuration 
Finish 
Drive Type ^ 
(C:) 22.11 GB 109.21 MB 二 
:) SOFTWARE 15.24 GB 260.67 MB v 





< Back Cancel | 





19-46 PowerPlay 安装 路 径 向 导 


然后 选择 安 猴 快捷 键 路 径 ， 如 网 19-47 ITR. 


W Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Shortcut Folder 
Shortcuts will be added to the folder shown. 


Welcome To put these shortcuts in a different folder, select an existing 


Licina folder from the list, or enter a new folder name. 


User Information Program folder: 


Installation Type 
[Cognos PowerPlay 


Component Selection 
Character Sal Selection Miss 5lder 
Installation Location 

BEA Products 


p Shortcut Folder Borland StarTeam 
8 


Summary 

Framework 
PowerPlay 
Configuration Transformer 


Finish 


Progress 


MV Make the shortcuts visible to all users. 





< Back Cancel | 





19-47 PowerPlay 安装 快捷 方式 问 导 


随后 系统 提示 安装 信息 ， 如 图 19-48 所 示 。 


Æ Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


Installation Summary 


The Cognos Installation Wizard is ready to install the components you 
selected. 
Welcome If you want to review or change any settings, select "Back . 


license If you are satisfied with the settings, select 'Next'. 


User Information Current Settings: 


Installation Type 
. Selected Components: 

Component Selection PowerPlay for Windows 
Character Set Selection PowerPlay for Excel 

: : PowerPlay Transformer Client for UNIX 
Installation Location sins s 

Access Manager Administration 
Shortcut Folder PowerPlay Transformer Edition Tools 
) Summary PowerPlay Transformer Edition Quick Tours 
PowerPlay Transformer Edition Samples 

Progress Default Font 


Configuration 
Finish 
Local disk space information: 


Drive: Available: Required Estimate: 


《 T | 





< Back Cancel | 





19-48 PowerPlay 安装 信息 界面 


单 击 Next 按钮 后 ， 开 始 安 疤 ， 随 后 进入 安 疙 组 件 癌 村 ， 如 图 19-49 所 示 。 
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Component Configuration 


Transfer is complete. 
You must configure the components to complete the installation. 
Welcome 


License 


Vser Information To configure components using the Configuration Manager: 


: (1) set the property values 
Installation Type (2) validate property values 
Component Selection (3) apply property values 


Character Set Selection (4) start services (if required) 


Installation Location 


Shortcut Folder 
Summary C Configure components with defaults. 


You have the following configuration choices: 


Ero es (e üpen the Configuration Manager to customize component 


p Configuration configuration. 


Finish Exit the Installation Wizard without configuring components. You 
C must later configure the components to complete the 
installation. 





图 19-49 PowerPlay 安装 组 件 向 导 
此 时 安装 完成 ， 如 图 19-50 所 示 。 


© Cognos 8 Business Intelligence OLAP Nodeling 8.1 Windows 


The Cognos Installation Wizard is complete. 
All selected components were transferred successfully. 
Welcome Configuration Manager terminated successfully. 


License 
User Information 
Installation Type 


Component Selection 


View View the transfer log. 


: View View the summary-error log. 
Character Set Selection 


Installation Location 
Shortcut Folder 


Summary 


View View the configuration log. 


Progress 


Configuration 
p Finish Please select 'Finish to close the Wizard. 


| View the Readme 


xn | 





图 19-50 PowerPlay 安装 成 功 界面 


接 下 来 束 可 以 进行 PowerPlay 的 使 用 了 。 
19.2. Cognos 入 门 前 的 准备 工作 


19.2.1 创建 Oracle 数 据 库 实例 


早 击 “开始 ”一 “程序 ”一 “Oracle - OraDb10g homel” 一 “配置 和 移植 工具 ”一 “Database 
Configuration Assistant” 命 令 ， 弹 出 如 图 19-51 所 示 的 窗口 。 
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istent : 9.2 1.1 





一 一 一 一 一 -一 一 一 一 一 





图 19-51 Oracle 安装 界面 


单 击 “ 下 一 步 ” 按 钮 ， 选 择 “ 创 建 数 据 库 ” 单 选 按钮 ， 如 图 19-52 Br. 


saistant， 步 可 1{ 其 12 步 ) : T, f mo 


图 19-52 Oracle 安装 向 导 


单 击 “ 下 一 步 ” 按 钮 ， 选 择 创建 数据 库 的 模板 ， 如 图 19-53 所 示 。 


imt, PR R 17 步 ) : 数据 库 模 板 ag s 


图 19-53 Oracle Zi qn] 5g 
单 击 “ 下 一 步 ” 按 钮 ， 输 入 要 创建 的 数据 库 实 例 名 ， 如 图 19-54 Wrzn. 


259 





图 19-54 输入 要 创建 的 数据 库 实例 名 
单 击 “ 下 一 步 ” 按 钮 ， 管 理 选 项 使 用 默认 设置 ， 如 图 19-55 Pr. 


tant, #R 4({ 共 12 步 ) : THARA 3g sli 





图 19-55 Oracle 管理 选项 设置 


单 击 “ 下 一 步 ” 按 钮 ， 设 首创 建 的 数据 库 实例 账号 的 登录 密码 ， 如 图 19-56 所 示 。 


LIONE 111707. 





图 19-56 Oracle 身份 验证 设置 


单 击 “下 一 步 ” 按 钮 ， 选 择 数 据 库 的 存储 机 制 ， 如 图 19-57 Br. 
336 


DE TTPTIETIEE JJ cin 12 3P) : TAAA 





图 19-57 Oracle 存储 设置 


单 击 “ 下 一 步 ” 按 钮 ， 指 定数 据 库 文件 在 磁盘 的 存储 位 置 ， 如 图 19-58 所 示 。 





图 19-58 Oracle 文件 存储 位 置 设置 
单 击 “下 一 步 ” 按 钮 ， 进 行 数 据 库 实例 的 恢复 设置 ， 如 图 19-59 所 示 。 


SOR 12 WO : BEEE 


图 19-59 Oracle 恢复 设置 


单 击 “ 下 一 步 ” 按钮 ， 执 行 运行 的 脚本 ， 和 暂时 先 不 运行 ， 选 择 黑 认 设置 ， 


如 图 19-60 所 示 。 


了 37 








图 19-60 Oracle 内容 设 置 


单 击 “下 一 步 ” 按 钮 ， 数 据 库 实例 的 初始 化 参数 设置 ， 包 含 “ 内 存 人 “调整 大 小 人 “了 孚 
符 集 ”和 “连接 模式 ” peni 2 19-61 Mene 





图 19-61 Oracle 初始 化 参数 设置 


选择 “学 符 集 ”选项 卡 ， 选 择 “ 从 字符 集 列 表 中 选择 ” 单 选 按钮 ， 然 后 在 “数据 库 字 符 
集 ” 下 拉 列 表 中 选择 “AL32UTF-8-Unicode UTF-8 通用 字符 集 ”， 在 “国家 字符 集 ” 下 拉 列 表 
二 选择 ^UTF-8 - Unicode 3.0 UTF-8 通用 字符 集 ， 兼 容 CE8U-8”( 此 步骤 相当 重要 ， 如 采 不 

设置 字符 集 ，Cognos | o 如 图 19-62 所 示 。 


Assistant, PA 10( ILI 12 W) : MARRON 





图 19-62 Oracle 字符 集 设置 
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单 击 “ 下 一 步 ” 按 钮 ， 进 入 数据 库 实例 的 存储 设置 ， 如 图 19-63 所 示 。 


P Database Configuration Assistant, +E 11( 夫 17 Y) - HEB TS 


| Heer dir PE 49i 
CINE SEE 
Laurus JB MATT s TTCUREREFORPERUERSTE UAI, UTER RUDNICRUEUEAUS (AN 
i kite PARERE THE : 


* HYPE 
- WS 

” ERXH 
* WER 
ERATU 


ETH- NESETHAL. AEtt. LLORENS. FERGE. MLTR SDTEAE pE 
HTHP: PERI 
ERP mERSSUMSERTHEEESESE.SxXdoEQNUERRBHEUECTHR. EAE 
B- AERA ATAN : 

* mm eEDHÉRTR 

- sevi pei. 





图 19-63 Oracle 存储 设置 


最 后 进行 数据 库 实例 的 创建 工作 ， 如 图 19-64 所 示 。 


D: Databaze Conil sguralron TITEIE TM wR zk 12 小) ; tacui] 


TESPEHE SE IARE: 
Ie AREE E E 
| STARRE 





图 19-64 Oracle 创建 设置 
单 击 “ 完 成 ”按钮 ， 完 成 数据 库 实例 的 创建 工作 。 
19.2.2. ”执行 建 表 空间 和 创建 数据 库 用 户 的 脚本 





/#* 创 建 表 空 间 的 脚本 

CREATE SMALLFILE TABLESPACE "COGNOS" DATAFILE 'D:\ORACLE\PRODUCTM0.2.0\ 
ORADATANXCOGNOSNXCOGNOS' SIZE 200M LOGGING EXTENT MANAGEMENT LOCAL 
SEGMENT SPACE MANAGEMENT AUTO; 

IGI EE FH P? FR ALAS wy 

CREATE USER "COGNOS" PROFILE "DEFAULT" IDENTIFIED BY "COGNOS" DEFAULT 
TABLESPACE "BI ETL" TEMPORARY TABLESPACE "TEMP" ACCOUNT UNLOCK 

GRANT "CONNECT" TO "COGNOS" 

GRANT "DBA" TO "COGNOS"; 
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19.2.3 ”Cognos 部 署 设置 


将 Cognos 服务 安 厂 目录 下 “...\cognosNc8\webcontent” 的 内 容 全 部 复制 到 “...\cognosNc&' 
webappsp2pdV" Fo 


19.2.4 配置 Cognos 服 务 


“开始 ”一 “程序 ”一 “Cognos 8” 一 “Cognos Configuration”， 局 动 Cognos Configuration 
工具 ， 进 行 Cognos 服务 的 配置 和 启动 ， 如 图 19-65 所 示 。 





Wy contetuer Dota Server 








Defrw à gop of properties uad to kxate an exnmg Cognes content darabane 
Erase tha a Cognos Content database has been rit led and configured eth Pe same port. 


图 19-65 Cognos Configuration 工具 


首先 ， 选 择 Environment， 在 右 侧 的 属性 里 ， 选 择 Sort buffer size in MB. ft Value 中 输入 
一 个 恰当 的 值 ， 比 如 “40” 然后 选择 Gateway URI， 在 Value 中 输入 “http://localhost:9300/ 
p2pd/servlet/dispatch”。 最 终 修 改 好 的 配置 如 图 19-66 Br. 




















Fie * 
j L f Fiabe 
IDE oor || 到 Piria em ton fie care aiarar (essor evil 
ag Pirta Tr vi nnl a hie Bas fi H 0 
Y Uk rona tebing 
lg ie nen || ® mbes UR Ic itp Uca uber E Tid pr ed [pu rs 
IU] cages abe: 
Mg orptog apiy ire regret Connie Fak 
四 ü 9 ed her Uls lor pitra Filip: ee dere 0e red omnid egal fefe 
lys sche: alio Pirri * Conrcler UE] for gaere "uti i ce aln np er cr len Sermo 
[IB oaa icons Cov herr Selle 
Mg ceres Hari Fpperuy deparites URE Perper "ER es pd eril eut rs 
IIl osx E itana diha AE fetis ee esit DE RU Pte hd at c 
m—— Doar aa re 
- Iona Pierani] Eger LET Se 
Wy certes Data Serves || * Dipatxher UE Por exteras agplications Ftp: ficat 22005 ped! ber eb pH ET 
|| € Content Marasser URH Pipe Dice sk EROR Ord E perdat 
Font Se 
Pry loris kxcstces die oberen C wp eot 
Pirra lore eue he edit Dott 
Foret lo seid (bapch nepeort onde crik ehe it baii 
Pres tà abad (réport parvia] adik ha dp batons 
| etene Secus rhe UR | té thë iem. 





| rd rip ber telnet a enn pe ea ee nd i ,re re oa re Brin ane or 
ad change rognos ng! Ea mod. potd ori hinis, Rn wad pagea- om PP UI FA-ETSC, cr ba rcd. cognos- p ri Lina E 
| ener trol ek TL i NL aerea Fle Pari uer portu ol! Hess gatea LIRE orn ie charped frain es albe. 1 an EP 
irs cr p ro rh Feel rama. 


图 19-66 Cognos Configuration 配置 
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其 次 ， 找 到 Data Access Content Manager Cognos Content Store， 单 击 右键 ， 将 其 删除 ， 
如 图 19-67 所 示 。 


EF-CFGJEUDES IJ 





图 19-67 ”删除 Cognos Content Store 


弹出 删除 提示 框 ， 单 击 Yes 按钮 ， 如 图 19-68 所 示 。 


Cognos Conf zon — i»lmU"A M DLURILM 











图 19-68 弹出 删除 提示 框 


删除 后 ， 右 击 Content Manager， 选 择 New resource 一 Database 命令 ， 新 建 一 个 数据 库 ， 
如 图 19-69 所 示 。 
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Cognos Configuration 一 FFF- CF63B08936C 







Content Manager - Component Properties 
Local Configuration (Name ooo O ae — 0 | 
& Environment -Save report outputs to a file system? — False 
Cognos content database 



















lif Portal Services 







Authentication 


Cryptography 
Cognos 
[ray Cognos Application Firewall 






Reset to Default 


Mew resource b Database... 


图 19-69 Content Manager 创建 源 数据 库 


在 弹出 的 对 话 框 中 输入 名 称 和 类 型 ， 如 图 19-70 所 示 。 


Cognos Configuration 一 WY-CF63B08936C 


= » J | uu T 
Content Manager - Component Properties 
Local Configuration 
Gi-[B Environment 
Pod Cognos content database 





i 而 | Cognos Application Firewall 
Data Access 








图 19-70 New Resource 设置 


配置 完 之 后 , 右 击 Cognos, 3% HII] cp se HR P XE PE Test 命令 进行 连接 测试 ,如 图 19-771 
所 示 。 
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Cognos Configuration 一 WWW-CF63BU08936C 








J Í c - 9 


COGNOS - Database - Resource Properties 
Local Configuration (]Nam — —  J[ ae O OoOo OE 
G-[8 Environment Type | E ase i 
| [fl Cognos content database Æ Database server and port number © localhost:1521 

- User ID and password IE 







































Cognos 8 service 


[m Cognos 8 
Hi] Portal Services 











s Authentication 
[gH] Cognos 








W Cognos Application Firewall 
& Data Access 
3f] Content Manager 


|; E Notificatior 
53-ig Cognos Ple 


o 







Reset to Default 






图 19-71 连接 测试 
如 果 测 试 成 功 ， 则 弹出 如 图 19-72 所 示 的 测试 提示 框 。 


Cognos Configuration 一 11 -CEFE63H08936C 


J : 2 


COGNOS - Database - Resource Properties 


lll Local Configuration 
G-[& Environment Type à ase 
: [EB Cognos content database * Database server and port number © lecalhost:1521 





User ID and password ttt 
File  Servic - 
Cognos 8 service 
Cognos Configuration 
Portal Services 
Security 
cm 
Hl authentication do 
|o [B] cogos b 
-区 Cryptography 
B D] Cognos 
i EE Cognos Application Firewall 
日 .| 时 Data Access 
-W Content Manager 





图 19-72 ”测试 提示 框 


测试 通过 后 ， 请 保存 劳动 成 果 ， 如 图 19-73 MR. 
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Cognos Configuration 一 WWW-CF63B08936C 


File 


Ctrl+5 


mente e LE. oracle - Database - Resource i — HÀ 





X [Service name 





E k Cognos 8 service 
(B Cognos 8 


[B] Cognos 
: B Cognos Application Firewall 
G-[& Data Access 


d Es Content Manager 


D] conos race 


| Notification 
E: Cognos Planning 
Iiis] Contributor Data Server 





图 19-73 ”保存 设置 
保存 成 功 后 ，Cognos 显示 如 图 19-74 所 示 的 信息 。 


Cognos Configuration 一 WY-—CF63B08936C 


D ÓÓÀ oracle - Database - Resource Aiuca MEN NI 
B Local Configuration 
日 二 Environment E 
P0] E Cognos content database 米 Database server and port number localhost: 1521 
Logging ser ID ， assworc 
[E] Fie ** Service name 
Cognos 8 service 
: B Cognos 8 
i Ry Portal Services 
9 H [nm Cognos Configuration 
B o Cognos 
- [* Cryptography 
[E] Cognos (ip 
i [rij Cognos Application Firewall 
&- [B Data Access 
un Content Manager 








Hi] Notification 
llf Cognos Planning 
if Contributor Data Server 














图 19-74 设置 更 改 提 示 框 
保存 后 ， 束 可 以 进行 Cognos 服务 的 局 动工 作 了 。 
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19.2.5 ”启动 Cognos 服 务 


Cognos 服务 的 局 动 有 两 种 方式 。 
1) 在 Cognos Configuration 中 ， 单 击 工具 栏 中 的 右 三 角 按 钮 P 启动 。 
2) 在 Windows 服务 中 ， 选 择 yomo: 8 选项 局 动 。 

















19.3 Cognos 入 门 实例 一 


本 实例 是 Cognos 的 初级 入 门 实例 ， 使 用 Framework 建 模 后 ， 直 接 在 Cognos Connection 
中 使 用 Report Studio 来 开发 一 个 简单 报表 。 
创建 数据 库 脚本 : 


create table PRODUCTS 
( 

ID | VARCHAR2(32) not null, 

NAME VARCHAR?2(100), 

TYPE VARCHAR2(2) 
); 
create table REGIONS 
( 

ID | VARCHAR2(32) not null, 

NAME VARCHAR?2(100), 

TYPE VARCHAR2(2) 
» 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0001', ' 红 木 家 具 ', '01*); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0002', ' 实 木 家 具 ', 027); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0003', ' 欧 式 家 具 ', 03"); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0004', ' 中 式 家 具 ', '04*; 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0005', ' 田 园 家 具 ', '05"); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0006', ' 地 中 海 家 具 ', 067); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0007', ' 时 尚 家 上 有 具 ', 07); 
insert into PRODUCTS (ID, NAME, TYPE) 
values ('0008', 现代 家 具 ', 085); 
commit; 
insert into REGIONS (ID, NAME, TYPE) 
values ('0000A', ' 昌 平 ", '02; 
insert into REGIONS (ID, NAME, TYPE) 
values ('0000B', ' 昌 平 ", '05*; 
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insert into REGIONS (ID, NAME, TYPE) 
values ('0000T', ' 西 城 ', '06"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000H', "西城 ', '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000G', ' 通 州 ,'027); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000F', ' 通 州 , '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000E', 海淀 ,'070); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000D', ' 海 泻 ', '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000C', "FXE", '04*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000M', 顺义 ', '06"; 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000L', ' 东 城 ', '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000K', ' 东 城 ', '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000J', ' 东 城 ', '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000N', 顺义 ', '07"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('00000', "BH", '01*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000P', '53] EH", '02"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Q', '=#BH', '03*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000R', "ii EH", '04*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000S', "i] EH", 05"); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000T', '3] EH', '06*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000U', '3 EH", '08*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000V', VK, '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000W', AX, '085); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000X', ^48", '06); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Y', ^48", '07); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Z', ' 延 庆 ', '04*); 

commit; 


19.3.1 


insert into REGIONS (ID, NAME, TYPE) 
values ('0000V', ' 大 兴 ', '05*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000W', AX, '085); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000X', 平谷, '06*); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Y', ^48", '07); 

insert into REGIONS (ID, NAME, TYPE) 
values ('0000Z', ' 延 庆 ', '04*); 


commit; 


使 用 Framework 建 模 


1. 打开 Framework Manager 





COGNOS” 8 Framework Manager 


= lasgar aLians pim helyis and pahi jak pariupan 





图 19-75 Framework Manager 界面 


2. 创建 一 个 新 的 工程 
New Project Aman] 19-76 Pros. 





New Project 


New Project 


Project name: 


[Sales 


Location: 


D:XtempiSales i i 


Project to be created 


D:NtemphiSales*hSales. cpf 


Repository << | 


Repository settings 
[ Add to repositorr 


Connection: 


| | £N, 


Location in repository: 





aen | am | 


图 19-76 New Project 界面 
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单 击 OK 按钮 后 ， 弹 出 创建 新 目录 提示 框 ， 如 图 19-77 所 示 。 





Framework Hanager 


T The directory you specified does not exist. Do you want to create it? 
i 


D:\cognos\Projects\, 


: Cancel | 








图 19-77 创建 新 目录 提示 框 
系统 开始 创建 ， 如 图 19-78 所 示 。 


Iba T3 frd de Manager 


GD Creating new project 
一 Creating model 





图 19-78 ”开始 创建 提示 框 


选择 语言 ， 如 图 19-79 所 示 。 


Select Language 


Select the design language for the project: 
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图 19-79 ”选择 语言 


选择 数据 源 ， 如 图 19-80 所 示 。 
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Netadata Wizard — Select Netadata Source 


c5 Jj N 


Select Metadata Source: 





aim Sources 
SB Cognos 8 Model 
(S Cognos Architect (*.zml) 


[M]Cognos Impromptu (*.zm1l) 

Pa Cognos DecisionStream (*.zml) 
Bf Cognos 8 Data Manager (*.zml) 
B Thi xa Party Metadata Sources 





Help | Cancel | 








19-80 ”元 数据 癌 导 
单 击 Next 按钮 ， 弹 出 如 图 19-81 所 示 的 对 话 框 。 


EE 





图 19-81 数据 源 问 导 
新 建 一 个 源 ， 如 图 19-82 所 示 。 


e New data source 


The New Data Source wizard helps you create a data source and a first connection in the Cognos 8 server. It also gives 
you the option to test the connection and to create a first signon. 


You can dick back at any time to change your settings. 


Please click Next to start creating the data source. 











Cancel || « Back Next » || Finish 








19-82 ”创建 新 数据 源 癌 导 


单 击 Next 按钮 ， 开 始 创建 数据 源 ， 如 图 19-83 所 示 。 
输入 名 称 后 ， 单 击 Next 按钮 ， 如 图 19-84 所 示 。 
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Sm New data source Ss New data source 


Specify a name and location for this entry. You can also specify a description and screen tip. Specify the parameters for the connection of this new data source. The name of the data source is used to set the name 
of the connection. 
Name: 


[B1 SOURCE ne 
| Oracle Y | 


Isolation level: 
(* Use the default object gateway 
(^ Specify a value: 


Description: 


BI SOURCE 


Screen tip: 
[Br souRcH Finish 


Location: 
Directory > Cognos 












































Cancel « Back | Finish 

















19-83 ”数据 源 名 称 及 描述 设置 19-84 ”数据 库 设 置 


选择 数据 库 类 型 ， 单 击 Next 按钮 ， 进 入 数据 库 连接 界面 ， 如 图 19-85 Wr. 
在 图 19-85 中 输入 数据 库 连 接 信 息 , 单 击 Test the connection 按钮 , 进入 数据 库 测 试 界面 ， 
如 图 19-86 所 示 。 


Sm Hew data source NEM Hew data source 


ER "E^ 


Edit the parameters to build an Oracle connection string. Test the parameters that make up the database connection. 





SQL*Net connect string: Connection string: 
| COGNOS ^User ID:^?Password:;LOCAL;OR;ORACLE@%s@COGNOS/%s@COLSEQ= 


Collation sequence: Test 


Dispatcher: 


Sinon http://liugf:9300/p2pd (Configuration) 


Select whether a user ID and password is required in the connection string and, if so, whether to create a signon. 














Test the connection using: 
[V User ID User ID: 


EZ Password : [B SOURCE 


IV Create a signon that the Everyone group can use: Password: 


User ID: ITI! 
[BL SOURCE 


Password: 


[essees 


Confirm password: 














Testing 


Test the connection... 





19-85 数据库 连接 19-86 数据库 测试 
单 击 Test 按钮 ， 进 入 数据 库 测 试 提示 信息 界面 ， 如 图 19-87 所 示 。 


-a Her dutnu source 





] => Name | Status 
UE => himig pad Sucneadas 


Cle 








19-87 数据库 测 试 提示 信息 
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测试 成 功 后 ， 返 回 数 据 库 连接 信息 界面 ， 如 图 19-88 所 示 。 


n 
s Hes data source *X 


Edit the parameters io bald en Orade coonecson string. 
SOL" Het connect sErimg: 
[cosas 


CesilaEnam mque p 


Sepan 
Select whether muer [D end passord i regured in the connecton string and. if so, whee bo Tese s Sga 
E uer a 
RÀ omes 
E Gene a egon farce Everpore grau cbr use: 
User ID: 
[ei souRCE 
lP'asseornd: 


lit 


Con pasamwend: 








19-88 ”数据 库 连 接 信息 


单 击 Next 按钮 ， 结 果 如 图 19-89 所 示 。 


Ss New data source 


Specify the commands that the database executes when certain events occur. 


Entries: -lk © | [Im 
厂 | Name | Value 
Open connection commands (None) 
Open session commands (None) 


Close session commands (None) 





Close connection commands (None) 











« Back | | Next 











19-89 数据库 执行 设置 
单 击 Finish 按钮 ， 结 果 如 图 19-90 所 示 。 


a New data source | 
Finish - New Data Source wizard Help 


The New Data Source wizard successfully created a data source and a first connection in the Cognos 8 server, 





19-90 ”数据 源 完 成 癌 导 
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关闭 对 话 框 ， 弹 出 图 19-91。 单 击 Next 按钮 。 
在 图 19-92 中 ， 选 择 要 建 模 的 表 ， 单 击 Next 按钮 ， 进 入 元 数据 向 导 ， 如 图 19-93 所 示 。 


Netadata Wizard — Select Data Source Netadata Wizard 一 Select Objects 


— 


(M | \ \ | 5 -— | \ | g 








Select a data source from the list defined in Cognos 8, or create a new Select the objects rou want to import. 


=- MA 51. sovncE 
日 BI SOURCE 
H-E Tables 
由 PRODUCTS 
* 
[ ]C3 Views 
[ ]C3 sznonzms 
[ ]CJ Procedures 
[| Functions 
多 cocos 
E crxsrs 
DbSHMP 
G nwsrs 
| OR Exrsrs 
G msys 


GA oLarsYs y 





FH 


E EE] EE] EH] 











E-E 


"hen a duplicate name is detected: 


(^ Import and create a unique name [ Show system obj 


(* Do not import this object 


Help | Cancel | Hezt Help | Cancel | < Back Finish | 
A i 














图 19-91 数据 源 问 导 界 和 面 图 19-9 KIZ 
单 击 Import 按钮 ， 结 果 如 图 19-94 所 示 。 


Metadata Fizard 一 Generate Relationships Metadata Fizard — Finish 
CEN 
m / 


Completed the import process. 








Relationships are created for you during the import of your data. 
Select the criteria to use to generate relationships. 


Select at least one criteria to detect and generate relationships. Created the following objects: 


Trpe: Query Subject, Count: 2 


厂 Use matching query item names that represent uniquely indezed 
columns 


E Use matching query item names 


Select between which set of objects you want to detect and generate 
relationships. 


(e Between the imported query subjects 


Between each imported query subject and all ezisting query 
subjects in the model 


C Both 


Indicate how rou want to generate relationships between the imported 
query subjects. 
Outer joins: 


f€ Comwavt ta innav inin [1 nl 


Help | Cancel | < Back Finish Help | Cancel | 














图 19-93 ”元 数据 问 导 图 19-94 ”元 数据 成 功 导 入 
单 击 Finish 按钮 ， 就 创建 好 了 一 个 工程 ， 如 图 19-95 所 示 。 
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-Sales *# — Franevwork Nanager 





| File Edit View Project Repository Actions Tools Help 


D| S Bue ka | € Bs X | a- E] eS 8 
和 Hack GForeend | 会 F ||sales 


Project Viewer Dx Tools nx 

- a Sales B Sales tÓ Summary 8] Search & Dependencies 

= 35) BI SOURCE 
c Wu] PRODUCTS 


a rp BI SOURCE 
(| mo 












































Select an object to view its dependencies 








(J| TYPE iz Explorer Qe Diagram [[[] Dimension Map Drag! & drop an eaea tirom the Project 
Ea u REGIONS viewer here to view its dependencies 
H H (8) Data Sources 
NAME 
(J| rrzz 


* 


(È Data Sources 
Parameter Maps 
(Gi Packages 





Parameter Maps 


E Packages 


fa 











十 








Dependent objects 

















PEE Bx No Dependencies Found 
Properties | Language 

Hame Sales 

Languages «Click to wiit. y 

Design Language en 




















— f. Show Object Id 


a Cm 








19-95 Framework Manager 界面 


3. 建 模 过 程 
在 导航 视图 中 选择 刚刚 导入 的 数据 库 表 ， 然 后 在 属性 窗口 中 设置 一 系列 参数 ， 比 如 名 称 、 
描述 、 外 部 方式 、 状 态 等 ， 如 图 19-96 所 示 。 


z Sales * 一 Framework Nanager efx) 


| Eile Edit View Project Repository Actions Tools Help 


| [3 | C H| Aind Red | 的 e x | 国 - |] ee d 
| 和 BacF  "hForward | t 全 ||sales j 




































































Project Viewer ox Tools ox 
日 a Sales B Sales t Summary | Search & Dependencies 
BI SOURCE = = : 

E Select an object to view its dependencies 
cz gy PRODUCTS 
Wr BI SOURCE 
M) save 
MW) TYrE iz Explorer $9 Diagram [[[] Dimension Map Iag 。 ia nid A pd n LA 
日 mi REGIONS wern penden 
[l 1» 向 | Data Sources 
M) save 
a Tere 
E Eg Date Sources Parameter Maps 
(F Parameter Maps EE] 
(gi) Packages 
E Packages 
Dependent objects 
colui Bx No Dependencies Found 
Properties | Language 
Hame PRODUCTS 
Description 
Last Changed 2007-05-25T11:24:54 
Last Changed Br Anonrzmous 
Model Comments 
Screen Tip 
Security Filters «Click to edit. > 
Externalize Method default 
Externalize &uto Summary false 
Status Valid 
~ii Show Object ld 

















EE IN 





19-96 表 属 性 设置 
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设置 完 表 属性 之 后 ， ———— 
大 小 、 


格式 、 类 型 、 


RAJ 
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ETNE 


， 如 图 19- 


97 所 示 。 


同样 ， 了 字段 属性 可 以 设置 名 称 、 摘 述 、 






















































































完 属 性 之 后 ， 


19-97 


字段 属性 设置 
导航 视图 中 显示 的 信息 如 图 19-98 所 示 。 


2 Sales + 一 Framework Nanager 


< Sales #4 一 Framnework Nanager 
| Ei Edit View Project Repository Actions Tools Help 
Bn | a Z l inds Okei | € Re MA X || E3- Hei 
| mPacl d i| t T ||Sales 
Project Viewer nx |f m || Tools Dnx,| 
日 B Sales B Sales | t3 Summary 名 Search & Dependencies | 
c [RE] 31_souRcE | —— : - 
— zm Select an object to view its dependencies 
二 gud PRODUCTS 
J| 1 BI SOURCE 
] 产品 名 称 ， ， E 
mi TYPE $= Explorer 9? Diagram 四 Dimension Map Yoda nm wh bae posl oca 
- Hj REGIONS NE RAO 
WM 1» (B Data Sources 
l me 
If TYPE 
uo Parameter Maps 
* Parameter Maps BB 
Ift] Packages 
E Packages 
Properties 
Properties | Language 
Hame 产品 名 称 ^| - —L 
Description || Dependent objects 
Last Changed 2007-05-25T11:28:13 
Last Changed Br Anonrmous 
Model Comments No Dependencies Found 
Screen Tip 
External Hame NAME | 
Is Hidden false | 
Usage Attribute 
Format «Click to edit. > 
Currency 
Data Type Character Length 16 
Precision 100 
Scale 0 
Size 202 
Is Hullable true 
Display Type Value | 
| MIME Type «| [ Show Object Id 
完成 E 






















































































| Fil Edit View Project Repository Actions Tools aE 
DI ZO ue |a Ba iX || 国 -| 
|] noi Ile — B n t -| 
和 Back mp F o it È |[Sa1es | 
| Project Viewer ox . Tools ox 
日 TE Sales B Sales | Summary 名 Search & Dependencies 
E 2 iind s Select an object to view its dependencies 
M 12 BI_SOURCE 
四 产品 名 称 
四 类 型 tz Explorer P Diagram [[[] Dimension Map Drag uu xal E -— y: bini EN ojec t 
二 ewer here ew dependencie 
- Wy] REGIONS 
Wr» fal Data Sources 
P 地 区 名 称 
四 产品 类 型 
由 (Bl Data Sources fagl Parameter Maps 
由 Parameter Maps EE] 
[gi] Packages 
题 | packages 
Properties 
Properties | Language 
Hame REGIONS : 
Description Dependent objects 
Last Changed 2007-05-25T11:293:50 
Last Changed Br Anonymous : E 
Model Comments No Dependencie Found 
Screen Tip 
Security Filters «Click to edit.» 
Externalize Method iqd 
Externalize iuto Summary false 
Status Valid 
[ Show Object Id 
z= Ow NN 





图 19-98 属性 信息 





然后 开始 设置 关联 关系 ， 单 击 Diagram 连接 ， 在 打开 的 窗口 中 显示 刚刚 建立 的 数据 库 业 
务 模型 结构 ， 如 图 19-99 所 示 。 
SPP ramerprkaiamazer ef) 


| File Edit View Diagram Project Repository Actions Tools Help 
[DIS H| Amr ee | X Es Ax | Elme 
| Back 加 Forward | Y F (£165 > BI_SOVECE ||R | & 100- E ZH) RS lb s 
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E FRE] »x. sov&cE £ £] & ependencies | 
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| Select an object to view its dependencies 
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Vie tecto vie is joi n 
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- Wy REGIONS 


ID 
地 区 名 称 
产品 类 型 














由 (È rata Sources 
由 Parameter Maps 
Ift] Packages 


Properties OFX || 











Properties | Language 





Hame BI SOURCE 











Description Dependent objects 
Last Changed 2007-05-25T11:25:03 
Last Changed By Anonrzmous 


Model Comments No Dependencies Found 


Screen Tip 




















| Show Object Id 


完成 | LN 


图 19-99 数据库 业务 模型 结构 


单 击 工具 栏 中 的 “连接 ”按钮 功 ， 然 后 在 PRODUCTS 与 REGIONS 之 间 画 一 条 连接 线 ， 
弹出 关联 关系 设置 对 话 框 ， 如 图 19-100 所 示 。 


Relationship Definition — PRODUCTS <—-> REGIONS 








Relationship Expression | Relationship SAL | 


Hame: 


[PRoDucTS <--> REĢIONS 


Query subject: Query subject: 


A Hew Link | Ems | 


ID 
产品 名 称 





Cardinalitr Operator Cardinality 





Relationship impact: Each REGIONS has one and only one PRODUCTS. 
Each PRODUCTS has one or more REGIONS. 


Expression: 


PRODUCTS. 类 型 = REGIONS. 产品 类 型 





图 19-100 关联 关系 设置 对 话 框 
355 


选择 PRODUCTS 的 “类 型 ”与 REGIONS 的 “ 





建立 好 的 关联 关系 如 图 19-101 PTR. 


2a Sales 一 Framework Manager 


ma 


j 


O> » 
品类 型 


KK, Aa ME” 





| File Edit View Diagram Project Repository Actions Tools Help 
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c gg] PRODUCTS 
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[+] 





Explorer ge Diagram | 四 Dimension Map 


r 
A REGIONS ^ 
































Tools 





t Summary 名 Search 总 Dependencies | 





Select an object to view its dependencies 





Drag & drop an object from the Project 


Viewer here to view its dependencies 





Dependent objects 











Properties Bx No Dependencies Found 
Properties | Language 
Hame PRODUCTS <--> REGIONS 
Expression «Click to edit.» 
Status Valid 
T 中 o2 ^ 
~ |T Show Object ld 
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业务 数据 关联 结构 


然后 单 击 “ 保 存 ” 按 钮 国 ， 如 图 19-102 PTR. 


-. Sales 一 Framework Nanager 





File Edit View Diagram Project Repository Actions Tools Help 








[DIS H| Awo ee |g Tax e men 
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iz Explorer me Diagram | 四 Dimension Map 


























Tools 
fj Summary & Search 把 Dependencies | 





Select an object to view its dependencies 














Wr» m : 
M 产品 名 称 区 PRODUCTS 众 i REGIONS A 
WE 类 型 ID Drag & drop an object from the Project 
Viewer here to view its dependencies 
c gm RECIONS Viewer her iew its dependenci 
WW rp 
W 地 区 名 称 
W 产品 类 型 
由 È rata Sources Framework Hanager 
E] Parameter Maps 
Fy Packages 
R Saving model 
Properties ox 
Properties | Language 
|  Hame PRODUCTS <--> REGIONS 
Expression «Click to edit.> Dependent objects 
Status Valid 
No Dependencies Found 
~| T Show Object Id 
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102 ”保存 设置 


人 至此， 使 用 Framework 建 模 的 过 程 全 部 完成 。 
4. 创建 包 及 发 布 模型 
模型 创建 好 之 后 ， 接 下 来 就 是 发 布 模型 的 过 程 了 。 








在 导航 视图 窗口 中 ， 右 击 Package， 在 弹出 的 快捷 灯 单 中 选择 Create7 Package 命令 ， 如 


图 19-103 所 示 。 
7i Sales 一 Framework Nanager 回回 加 
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Run Model Advisor 
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No Dependencies Found 








Select All Similar Objects 

















[万 Show Object ld 


Package | nm —— 
图 19-103 ”创建 包 


输入 发 布 包 的 名 称 及 相关 描述 ， 如 图 19-104 所 示 。 
输入 完成 后 ， 单 击 Next 按钮 ， 弹 出 需要 发 布 的 模型 ， 如 图 19-105 PTR. 


Create Package — Provide Name 
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PWN 


Name: Define the objects rou want to include in this package 
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packages 











Description: 
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(* From the project 
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Help | Cancel | jack Firi st Help | Cancel | < Back Finish | 
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图 19-104 包 名 及 描述 设置 图 19-105 需要 发 布 的 模型 
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选择 完 之 后 ， 单 击 Next 按钮 ， 弹 出 可 用 的 一 系列 功能 集 ， 这 里 选择 Oracle, Xt 


Oracle 添加 到 大 侧 区 瑾 ， 如 图 19-106 所 示 。 


单 击 Finish 按钮 ， 完 成 包 的 创建 。 











包 创 建 完 成 之 后 ， 系 统 弹 出 是 盏 打 开发 布 包 同 导 的 提示 框 ， 如 图 19-107 所 示 。 单 击 Yes 
按钮 ， 弹 出 发 布 包 癌 导 对 话 框 ， 如 图 19-108 所 示 。 


Create Package — Select Function Lists 


[59] 





Select the set of functions that will be available in this package. 


Available function sets: 


Selected function sets: 
Dracle 


Define Quality of service | 


Help | Cancel | < Back | Hezt | 


图 19-106 ”功能 集 








AmericaFire * 一 Framework Nanager 


You have successfully created your package. 
Would you like to open the Publish Package wizard? 





图 19-107 
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Æ Cognos 8 Content Store 下 的 列表 中 ， 选 择 要 发 布 到 的 本 地 目录 ， 以 便 在 Cognos 
Connection 中 打开 该 模型 制作 报表 。 单 击 Next 按钮 ， 进 入 安全 设置 界面 ， 如 图 19-109 所 示 。 
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Cancel | 
图 19-108 AHE pE 
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Publish Wizard 一 Add Security 


z > EM 
| | 
User Access | Administrator Access | 


E 
f 6 于 aC 
(Qh E 


Specify access permissions for this package. These settings are only 
available on the initial publish. 


Selected groups and roles will be able to use this package to create 
reports. 


Ho security defined 


Ck mea | 


图 19-109 ”安全 设置 


暂时 不 做 设置 ， 直 接 单 击 Next 按钮 ， 进 入 发 布 前 的 验证 设置 ， 如 图 19-110 所 示 。 
设置 完成 后 ， 单 击 Publish 按钮 完成 发 布 ， 如 图 19-111 所 示 。 


Publish Wizard — Options Publish Wizard — Finish 
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Do rou want to: 
(* Exit this wizard 


Click Publish to publish rour package. 
(C Publish another package 


The following groups have administrator access to the package: 


Directory Administrators [Directory > Cognos] 


Launch Cognos 8 | 
< Back Publish Cancel | Help | 





图 19-110 “验证 设置 图 19-111 完成 发 布 


19.3.2 ”使 用 Report Studio 制 作 报表 


登录 http://localhost:9300/p2pd/servlet/dispatch 网 址 ， 单 击 右上 角 的 Launch， 在 弹出 的 下 


拉 列 表 中 选择 Report Studio 选项 ， 如 图 19-112 所 示 。 
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完成 QD Internet Hi = 


图 19-112 Cognos Connection 界面 


TEBEFE ES TEL] HR SPERA RC REIR] E "Poe PSPCTAC, 如 图 19-113 Brzs. 
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图 19-113 HE 


直接 单 击 链接 ， 首 先 加 载 ， 如 图 19-114 所 示 。 
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图 19-114 ”加 载 界面 
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加 载 完 之 后 ， 进 入 Report Studio 的 欢迎 界面 。 在 该 界面 中 ， 单 击 Create a new report or 
template 投 钮 创建 一 个 新 报表 ， 如 网 19-115 所 示 。 
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图 19-115 Report Studio 欢迎 界面 


在 弹出 的 报表 类 型 中 ， 选 择 List， 然 后 单 击 OK 按钮 ， 如 图 19-116 所 示 。 
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进入 Report Studio 报表 开发 界面 ， 如 图 19-117 所 示 。 


拖 住 左边 Insertable Objects 工作 区 内 的 表 PREGIONS 中 的 “地 区 名 称 ” 列 到 右 侧 的 表格 





Wew — Report Studio — Findows Internet Explorer 
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图 19-117 Report Studio 报表 开发 界面 





中 ， 如 图 19-118 所 示 。 
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图 19-118 ”页面 布局 图 


同样 ， 将 “产品 类 型 “产品 名 称 ” 列 拖 入 石 侧 工 作 区 。 最 后 的 效果 如 图 197119 所 示 。 
































New+ — Report Studio 一 Findows Internet Explorer s7 
FO RHEO SEV KEKA IA $8B500 
一 一 一 CA FRA LE 一 一 一 
e € E| http: //1localhost:9300/p2pd/pat/rsapp. htm hé | ea | x| | 百度 L |z | 
w k BB ww Folders - Cognos Co... aee - Report Studio X = D- dh - 了 牙 页 面 E) - G IAO ~ M 








File Edit View Structure Table Data Run Tools Help | 


DEH eea agm -TRB-ie- tia IY 4-4 xz- Biel i 8S5 mus ? 
[* | zb: HA-s:zviezessirtHHis&-i-—Lb-:18-iB- Existe &dxivvüu 
i i 
Insestable Objects Double click to edit text 






























BENMCINNMUM  -— 5 — 01. — —— —— alls E E E dus 
= 而 PRooucns | 






< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 
< 地 区 名 称 > < 产品 类 型 > < 产品 名 称 > 











c Wü REGIONS 

(M 1D 

(M. 地 区 名 称 
a 产品 类 型 
































图 19-119 报表 设置 界面 


报表 列 设计 好 之 后 ， 设 计 报 表 和 名称， 双击 Double click to edit text 字体 ， 在 弹出 的 Text 对 
话 框 中 输入 “产品 销售 区 域 ”， 然 后 单 击 OK 按钮 ， 如 图 19-120 所 示 。 
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图 19-120 设计 报表 名 称 
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设计 好 的 标题 如 图 19-121 所 示 。 
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图 19-121 报表 界面 


接 下 来 ， 将 “产品 名 称 ” 列 分 组 显示 。 首 先 选 中 “产品 名 称 ” 列 ， 然 后 单 击 工具 栏 中 的 
Group / Ungroup Zh, "l| 19-122 所 示 。 
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图 19-122 分 组 设置 
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列表 “地 区 名 称 ” 中 将 多 出 一 个 图 标 ， 如 图 19-123 PR. 
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图 19-123 分 组 图 标 








接 下 来 , 选中 空白 区 域 , 单 击 工 具 栏 中 的 Center 按钮 将 表格 居中 显示 , 如 图 19-124 所 示 。 
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图 19-124 居中 显示 表格 
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至 此 ， 报 表 基 本 上 就 设计 完成 了 。 
19.3.3 ”查看 报表 


报表 设计 完 之 后 ， 台 可 以 奋 看 报表 了 。 单 击 工具 栏 中 的 Run Report 按钮 ， 系 统 将 以 报表 
的 方式 显示 刚才 完成 的 设计 ， 如 图 19-125 所 示 。 














rq sud SFY weg IR Why 


~en - —— —- 
(wur E daplon: 9000/pep/ pet/rsapp. hta u f  Bilrixi|5m. JAF 

Y - 一 一 »- 
* « a^ ] ad € Folders = Cognos Co. PEL = Raport Stadio X | 全 H [. > meo y SIRAY * 


Fie Pdt View Structure Tabie Data Run Tool Help i 


DGHixmGexioo!srmk[alh-le--1t1/5 «7 aa MEEA? 











^ a) rocucrs | MES $i | FREE 3 | r&sm $ | 
Las queam FAR < 严 品名 称 > 
ii ET HESR BAI Pask- 


=> Conditional s 
Condtong Styles 


Stie vacabe 


=i Box 了 | 


L ————— M — MÀ ——— ——— er er aree rr ure rrr ae rrr rm 
CO COCO OC CO 


元 成 Li OQ etes "4109 7 二 





图 19-125 ”运行 报表 


报表 显示 如 图 19-126 所 示 。 
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图 19-126 报表 展示 图 
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经 过 以 上 步骤 的 练习 ， 访 者 已 经 对 Cognos 报表 制作 的 流程 和 工具 的 使 用 有 了 初步 的 认 
识 。 在 19.4 市 中 ， 将 介绍 Cognos 的 另 一 个 入 门 实例 。 


19.4 ” Cognos 入 门 实例 二 


经 过 上 面 的 简单 入 门 实例 ， 读 者 已 经 大 概 熟 悉 了 Framework 建 模 工具 的 使 用 ， 以 及 使 用 
Report Studio 制作 报表 的 步骤 。 在 本 节 中 ， 将 使 用 Transformer 立方 体 建 立 多 维 模型 ， 然 后 使 
用 Analysis Studio 来 制作 多 维 分 析 报 表 。 


19.4.1 使 用 Framework 建 模 








1. 创建 数据 库 脚 本 


create table SALES 
( 

1d 

product name 


varchar2(32) not null, 
varchar2(100), 
varchar2(100), 
varchar2(100), 

date, 

number 


produtct type 
region name 
dates 
amounts 
); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8a81918e2f9bcf3a013044fb7b5a027€', 
‘dd-mm-yyyy')); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8381918e2f0bcf3a012ffbf7b4610063', 
dd-mm-yyyy?)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8381918e2f0bcf3a012ffbe57a19005f, 
'dd-mm-yyyy?)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8a381918e2f0bcf3a012ffbcb3fal005d', 
dd-mm-yyyy?)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8381918e2f90bcf3a01304412c43e027c', 
dd-mm-yyyy?)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 
values ('8381918e2f0bcf3a013044123c730277b', 
‘dd-mm-yyyy')); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 


H' 


"FK GC ZR Rs '03', "SHEH', 780, to date(13-05-2010", 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 
"Jh cR IREZE HUS 106, 2, 26, to date(18-11-2009', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 


! AA 
ZN’ 


' 松 术 家 具 '，'08' 263, to date('20-05-2010', 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 


! AA 
ZN’ 


JU ZX RSS '05', 485, to date(31-08-2009', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 


目 ， 


ZN 9 


实木 家 '02',，' 朝 阳 '，88，to date('01-10-2010', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 红 木 家 有 具 '，'01'，' 朝 阳 '，1080, to date(31-12-2010', 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 
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values ('8381918e2f0bcf3a012ffc04955e0064d', 
‘dd-mm-yyyy')); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8a81918e2f9bcf3a012ffc0072870069', 
‘dd-mm-yyyy')); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8381918e2f9bcf3a012ffbfdd4520067', 
dd-mm-yyyy?)); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8381918e2f0bcf3a012ffbfa4d7d0065', 
‘dd-mm-yyyy')); 

commit; 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8a381918e2f0bcf3a012ffbbe5a250059', 
dd-mm-yyyy?)); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8381918e2f0bcf3a012fd3d0b3100040', 
dd-mm-yyyy?)); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8381918e21f9bcf3a012fd3cdb10f003d', 
dd-mm-yyyy?)); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 

values ('8481918e219bcf3a0130441fb8e2c027f, 
'dd-mm-yyyy’)); 

insert into SALES (ID, PRODUCT NAME, 
DATES) 


values ('8a81918e2f9bcf3a0130450794590282', 


'dd-mm-yyyy')); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 


values ('870c773a549a49e3acd2d6da426c0260', 


'dd-mm-yyyy')); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 


values ('d680c1c5b0534a8 1aa0ed0331f8b6f17', 


'dd-mm-yyyy)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 


values ('55b9362a7a65c43ab95150f3c793c2ddf, 


'dd-mm-yyyy)); 
insert into SALES (ID, PRODUCT NAME, 
DATES) 


values ('4a478c7241314cc3b0748f93718bb80e', 
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JL FCZR HIS 05", 39 BH, 956, to date('01-01-2011', 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 


1 EH 
E 


"SEIN ZK HL, 02, ' E", 354, to date('01-05-2011'", 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 


H! 


中式 家 有 具 '，'04, '4ER', 261, to date('15-09-2010', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 


H! 


ZN 9 


"EF i '07', F A', 182, to date('20-05-2009', 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 
HAA, 05, 'ZR BA, 820, to date(21-07-2011', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 欧 式 家 具 '，'03', ' ZR, 366, to date(22-11-2010', 


PRODUTCT TYPE, REGION NAME, AMOUNTS, 


H' 


ZN 393 


' 红 木 家 '01', 'ZR3À', 452, to date(10-05-2011', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 田 园 家 具 '，'04', "SH PBH', 1823, to date(30-09-2009', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 现 代 家 具 '，'05', ' 昌 平 '，652, to date(16-10-2010', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 地 中 海 家 具 '，'06', "SHBH', 462, to date(20-12-2010', 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 中 式 家 具 '，'04'，' 海 淀 '，116，to_date(20-03-2009，， 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 
' 现 代 家 具 '，'05', ' 海 演 '，286，to_date('01-04-2009,, 
PRODUTCT TYPE, REGION NAME, AMOUNTS, 


"BP ESZKHS COT, ' 海 淀 '，450，to_date('31-01-2010, 


'dd-mm-yyyy)); 
insert into SALES (ID, PRODUCT NAME, PRODUTCT TYPE, REGION NAME, AMOUNTS, 
DATES) 


values ('ff80808132810e4901328f47b0340032', TAZKZKR.', '08', '39] BH", 295, to date('01-10-2010', 
'dd-mm-yyyy")); 
commit; 


2. 新 建 一 个 项 目 
PEM H I] Se E] 19-127 所 示 。 


New Project 


| New Project 


Project name: 


[Sales2 


Location: 


加 :Atempvsales2 B | 








m Froject to be created —— 





D:\temp\Sales2\Sales2. cpf 


Repository << | 


r Repository settings 
[| Add to repository 
Connection: 
| E | £N 
ce 


Location in repository: 





图 19-127 新建 项 目 向 导 
数据 库 表 使 用 上 面 SALES K. 
导入 数据 库 的 过 程 和 建 模 过 程 在 19.3 节 中 已 经 介绍 了 ， 这 里 就 不 再 袭 述 。 创 建 好 的 模型 
及 发 布 的 包 完 成 后 ， 如 图 19-128 所 示 。 
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图 19-128 ”模型 图 
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其 中 ， 需 要 注意 的 一 点 是 : 将 模型 SALES 的 Externalize Method 属性 值 设 置 为 .i.qd， 并 设 
置 保 存 的 ,iqd 路 径 ， 然 后 再 进行 发 布 ， 如 图 19-129 PZR. 


Publish Wizard 一 Options 


Externalized query subjects 


lv Generate the files for externalized query subjects 


Hetwork location: 
D:Xtemp^iSales2 


V Verify the package before publishing 


Click Publish to publish rour package. 





图 19-129 发 布 向导 


19.4.2 ”使 用 Transformer 立 方 体 多 维 建 模 


1. 新 建 Transformer 多 维 模型 
打开 路 径 : 选择 “开始 ”一 “程序 ”一 “Cognos Transformer” > “Transformer” MẸ, 
如 图 19-130 所 示 。 





Eds Kim Sri d 
|De&H&oe9-xmdXomEkxuec 





19-130 Transformer 界面 
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单 击 工具 栏 中 的 喇 按 钮 新 建 一 个 模型 ， 弹 出 如 图 19-131 所 示 的 对 话 框 。 


ETC 











图 19-131 新 建 模型 向 导 


单 击 “ 下 一 步 ” 按 钮 ， 输 入 模型 名 称 ， 如 图 19-132 所 示 。 
输入 模型 名 称 后 ， 单 击 “ 下 一 步 ” 按 钮 ， 进 行 数据 源 和 数据 类 型 的 设置 ， 如 图 19-133 所 示 。 


Flease enter a name for your model. Please enter the name and the type of your 
data source. 


Model name : Data source name: 


[Sales , sales 


Data source type: 








取消 |«t-ro[r—£o | | Help | r 取消 |«t—5 v [7-535] 
图 19-132 ”输入 模型 名 称 图 19-133 ”设置 数据 源 和 数据 类 型 
在 Data source type 下 拉 列 表 中 ， 选 择 Impromptu Query Definition 选项 ， 这 里 使 用 在 上 市 中 
保存 好 的 .iqd 文件 作为 数据 产 ， 单 击 “ 下 一 步 ” 按 钮 ， 进 行 选择 数据 源 路 径 ， 如 图 19-134 所 示 。 
单 击 “ 下 一 步 ” 按 钮 ， 完 成 数据 源 的 寻 入 ， 如 网 19-135 所 示 。 


Hew Nodel New Hodel 








Please enter the following information about You have finished specifying the data source 
your data source. i " for your Transformer model. 


File name: 
[D:XtempXSales2ABI TARGET SALES. iqd : Please specify if you want to run Autolesign 
D:itempYSalesZABI TARGET SALES. iqd to create a preliminary model you can edit in 
the Dimension Map. Depending on the option 
Browse... | that you have chosen, Autollsign may not be 
Isolation level: 


[Default ”| 


取消 ”| <-s [TE 取消 ”| < 上 一 步 @)|[_ sm | 
图 19-134 ”选择 数据 源 路 径 图 19-135 ”完成 数据 源 的 导入 
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选择 Run AutoDesign 复 选 枉 ， 然 后 单 击 “ 完 成 ”按钮 ， 
这 时 弹出 Transformer Error 提示 框 ， 如 图 19-136 所 示 。 I) ee ee pe 

分 i; jr jA ， n le 提示 连接 数 据 源 错 误 l 需要 在 Definition (IQD) Runtime Gateway location, or from IQD file. 
COGNOS.ini 文件 中 添加 配置 来 完成 与 数据 源 的 连接 。 

打开 Cognos 的 安装 目录 ， 找 到 COGNOS.ini 文件 ， 双 
击 打开 ， 在 文件 末尾 添加 如 下 议 置 : 


BI TARGET-^User ID:^2Password:;LOCAL;OR;ORACLEY%Ss(usa/ yosOCOLSEQ= 


其 中 ，BI TARGET 是 数据 源 的 用 户 名 。 
然后 单 击 “ 完 成 ”按钮 , 将 弹出 提示 输入 用 户 名 和 密码 的 登录 对 话 框 ， 如 图 19-137 所 示 。 





19-136 Transformer Error 提示 框 











Database Logon (BI TARGET) 


Enter a user ID and password that is valid for the database. 
User ID: 


[BI TARGET 


Password: 


Cancel | 








图 19-137 ”数据 源 登 录 对 话 框 


输入 数据 源 的 用 户 名 和 密码 后 , 单 击 Log On 按钮 ,完成 新 模型 的 创建 工作 ,如 图 19-138 
PIE 











Eile [phi Vies [dun [Hapua Teels areiiy Findew Halp 


DS 








a iz IX ii Custom Fiesa 


图 19-138 创建 的 新 模型 
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2. 多 维 模 型 设计 


卖 认 的 设置 可 能 有 些 个 符合 多 维 模型 设计 征求， 这 时 需要 手工 进行 调整 。 肯 先 设 蜀 维度 ， 
如 图 19-139 所 示 。 








Pile Edi Yie bm [diagrams Lal Borewmily Wonder Hele 
DHS no-*x-u-goófn mxuge 


Eragarties 


Insari Lavel 
Data Eirard 


The Cris 

Sh Fera 

Bha Diapram 

Laanarl Dimaniian Érom Package. 
[orari Dinanzian 


| BATTU TI IE DTENTITT 
tilas 


Eo 

Erast 
M rac 
| 加 EAS 
(M seit EE 





Deletes tha salectad item 
图 19-139 ”维度 调整 操作 


右 击 维度 窗口 中 的 ID， 在 弹出 的 快捷 来 早 中 选择 Delete Dimension 命令 ， 即 可 将 其 删除 ; 
“产品 类 型 ”也 用 同样 方法 删除 。 最 终 效果 如 图 19-140 所 示 。 


Tranafnrarr 





Bil. BHs Wiar Bun Damia Tesla Secwrity Window Mels 
DH o4xedOolxEEZug e 
il Dimension E ip 


" PpowmorCobhos n: Cerine Vires 


H ru 
FET 





图 19-140 ”最 终 模 型 效果 图 
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用 同样 方法 进行 Measures 的 设置 。 
3. 创建 立方 体 


单 击 工具 栏 中 的 万 按钮 创建 立方 体 ，Transformer 将 自动 创建 一 个 立方 体 模型 ， 如 
图 19-141 所 示 。 





Status 


Data Source: sales 


Source File: D:stemp*Salesz*Bl TARBE... 


Step £: Heading source data. 


Categories: 83 
Records: 1 





19-141 创建 立方 体 


创建 完成 后 ， 在 PowerCubes 窗口 中 将 显示 已 经 创建 好 的 立方 体 ， 如 图 19-142 所 示 。 


L Transforaer — New Hodel 





File Edit View Run Diagram Tools Security Window Help 


|DBH& o4xc-30 B EHEuxG 6 





BE ES remm 


à)BI: 


jiii — eene "PE 


creme "Ed F- PowerCubes 


a zm FSales 


| "PES 


ri 
(M. 统计 日 期 





I 下 英才 回放 








图 19-142 立方体 模型 
4. 发 布 立 方 体 
右 击 Sales， 在 弹出 的 快捷 亲 蛙 中 选择 Publish PowerCube as Data Source and Package 命令 
进行 立方 体 的 发 布 ， 如 图 19-143 所 示 。 
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L Transforaer — New Hodel 





File Edit View Run Diagram Tools Security Window Help 


DEHA Atx MRE 











TT "ppm 下 ap 回回 四 X Signons 


Dicen 


lll Data Sources "HIE ! Neasures | , 加 回国 H Custom Views "EG 
- fa 数 量 





Properties 
Delete PowerCube 





Create Selected PowerCube 
Update Selected PowerCube... 
a 统计 日 期 Publish PowerCube as Data Source and Package... 





PowerCube Partition Status... 





amate en ote Secur e Nh ante 





PowerCube Status... 








Insert PowerCube... 





Frams 





图 19-143 发布 立方 体 
弹出 Publish PowerCube 对 话 框 ， 如 图 19-144 所 示 。 


Publish PowertCube 


Publish Status 


Property — — — (Value S 


Powercube creation Enabled 

Status OK 

Date 2007-5-25 15:13:20 

Data Source Sales 

Windows Location DBackupm Bae TransformerlPowercubestsales.... 
Unix or Linux Location 

Last published datetime 

Published status Mot published 


Select å Publish Method 
(* Start publish wizard 
Ù Publish the PowerCube using current settings 


(^ Create publish specification 


tan external XML File, containing settings From khe modeli 





19-144 Publish PowerCube 对 话 框 








选择 Start publish wizard 单 选 按钮 以 问 寻 方式 进行 一 个 立方 体 的 发 布 。 单 击 OK 按钮 ， 如 
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19-145 所 示 。 


EE Publish PowerCube az Data Source and Package 


Verifying security setti: 
Please wait... 


" 


(Connecting to: http://localhost:9300/p2r 

b action-xts.run&nmn-portal/new connection. xts&from transf-l&h C? 
bbo9dfs38aT3fe:Z825b59515b5bdkm connection type-powercube&m p defaultName-WRB5S8519530*EE 
abem p defaultliescription-&m p defaultscresnlip-&m connection windows cube- 
5CTransformerW5CPowertCubesWbCWEDX81W9g0NEDSsOSSONESAAZXADRSESS 

&ab.mdc&m connection unix cube-&m package dialog Ü text packazeName-XEb*S81W30NED 
opem package dialog 0 textÁrea packagslescription-&m package dialog Ü text packe 





图 19-145 发布 向 导 
在 进行 安全 验证 之 后 ， 将 跳 转 到 下 一 个 对 话 框 ， 如 图 19-146 所 示 。 


L Publish PowerCube as Data Source and Package 


The New Data Source wizard helps you create a data source and a first connection in the Cognos 8 server. It also gives you the option 
to test the connection and to create a first signon. 


You can Click back at any time to change your settings. 


Please click Next to start creating the data source. 


Cancel || < Back | | Next» || 











图 19-146 ”创建 数据 源 问 导 


单 击 Next 按钮 ， 进 入 数据 源 设置 界面 ， 如 图 19-147 PZR. 
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EE Publish PowerCube as Data Source and Package 


ec mee ee ede Ee ee CC 


specify a name and location for this entry, You can also specify a description and screen tip, 


Name: 


[sales 


Description: 


Location: 
Directory » Cognos 





图 19-147 ”数据 源 设置 
在 图 19-147 中 输入 名 称 和 摘 述 等 信息 后 ， 单 击 Next 按钮 ， 进 入 连接 串 设 置 界面 ， 如 
图 19-148 HIZR o 


是 Publish PowerCube as Data Source and Package 
Specify the Cognos PowerCube connection string - New Data Source wizard 
Edit the parameters to build a Cognos PowerCube connection string. 


Read cache size (MB): 


E 


Location 
Specify the location of the cube on a Windows operating system. If the cube also resides on a Unix or Linux operating system, enter 
its location. 


Windows location: 


[D: Backup ff) SERE Transformer |PowerCubes|Sales.mdc 


Unix or Linux location: 


Pre ooo 


Signon 
Select an authentication method. 


(* All applicable namespaces (including unsecured PowerCubes) 
(^ Restrict PowerCube authentication to a single namespace 


| z] 


Select whether a cube password is needed. 


[ Cube password 
[9 Create a signon that the Everyone group can use: 


Password: 


PP 一 


Confirm password: 


o — — 


Testing 


Test the connection... 


| Cancel « Back | Next » || Finish 
图 19-148 ”连接 串 设置 
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在 Read cache size(MB) 文 本 框 中 输入 “10” 然后 单 击 下 方 的 Test the connection 按钮 进入 
测试 连接 界面 ， 如 图 19-149 所 示 。 


W Fublish FowerCube as Data Source and Fackage 


Test the parameters that make up the database connection. 


Connection string: 
^PPasswordi;LOCAL;PCWIN_PATH =D: Backup RA b 
\Transformer PowerCubesSales. mdo UNIX_PATH =;readCacheSize = 10;cubePassword - 9/55 


Test 


Dispatcher: 
http: //liugf:3300/p2pd (Configuration) 


Test the connection using: 
Cube password: 


Roo 





图 19-149 测试 连接 界面 
单 击 Test 按钮 进行 测试 ， 这 时 Transformer 报 如 下 错误 ， 如 图 19-150 所 示 。 


EE Publish PowerCube az Data Source and Package 


| => Name | Status | Message 


-.2 http://liugf:9300/p2pd Failed PCA-ERR.-0006 The argument is invalid. 





图 19-150 ”测试 结果 


单 击 Failed， 弹 出 详细 错误 信息 提示 框 ， 如 图 19-151 所 示 。 
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Windowz Internet Explorer 





PCA-ERR-ÜDDB The argument is invalid. 

RSV-SRV-ü042 Trace back: 

RSReportSerwicse.cppiT4T]: UFException: CCL CAUGHT: RSReportSerwice::process(] 
RSReportSerwiceMethaod. cpp 21T): gFException: CCL RETHROW: R5SReportSerwiceMethad::pracess(i: 


reportTestlataSourceLonnection Requezt 





RSQueryMzr.cpp(lT86]: QFException: CCL RETHRÜW: R5QueryMzgr::testlataSource 
RSQueryMzr.cpp(l4T5]: QgFException: CCL RETHRÜW: R5üueryMgr::executeRzapiLommand 
RSQueryMzr.cpp(l482]: QFException: CCL RETHRÜW: RS5QueryMgr::executeRzapiCommand 
RSQueryMzr.cpp(l43T]: QgFException: CCL RETHRÜW: R5iueryMgr::executeRzapiLommand 
RSQFSession. cppí186]: QFException: CCL RETHRÜW: RSQFSeszion::DoRequeszt 


QFSSession. cpp E04]: BFException: 
QFSSession. cpp 02]: QFException: 


QFSSession. cpp 464): QFException: 


DLAPPIannerBgFSConnection. cpp (4287 


DULAPP1annerBgFSConnection. cpp [425]: 


CCL RETHRÜW: QFSSession: :FrocessloRheguest 门 
CEL CAUGHT: QFSSession::FraceszlloRequest I] 
CCL RETHRÜW: NFSSession: :SessionProcessTestConnection k] 
: QFException: CCL RETHRÜW: DFAFSConmection: :ProwiderTest 
QFException: CCL CAUGHT: OFAFSConmnmection: :ProwiderTest 


QFSSession. cpp (B04): QFException: CCL RETHROW: QFSSession: :ProeessIoReguest i] 
QFSSession. cpp E02]: QFException: CCL CAUGHT: QFSSession: :Processloheguest [ 
QFSSession. cpp (146B4): QFException: CCL RETHRÜW: QFSSession::SessionProceszTestConnection(] 
MPCAPPDS. cpp 82]: QFException: CCL THRÜW: MPCAConnection::GetCharSaet 











图 19-151 错误 信息 提示 框 








分 析 错 误 原 因 ， 霹 成 该 错误 的 原因 是 子 侍 集 不 匹配 ， 进 行 如 下 修改 ， 如 图 19-152 所 示 。 


L Transforaer — New Hodel 





I Edit View Run Diagram Tools Security Window Help 





New... CtrltN 

Üpen... Ctrltü ——————————————————À 

Close E E E ` Signons [- [n | x 
Wáje ra ————— | 

Save CtrltS 

Save Ås... 

Session Information 

Currency Table... 

Print Setup... 

Frint... Ctrl+P 

Preferences... F5 


Model Froperties 


1 D:AtempySales3Sales3. pyj 

2 D:\temp\Sales2\SALES2. pyj 

3 D: ABackup AERE Transformer Models Ae, pyJ 
4 D: Backup AZ PáATr ansformerMModelssgolll.pyj 





[ES *- PowerCubes Bf) s Custom Views "E 





Exit AlttF4 











图 19-152 模型 属性 设置 


打开 Model Properties 页 面 属性 ， 修 改 Cube code page 值 为 “UTF-8” 即 可 ， 如 图 19-153 
所 示 。 
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模型 子 符 集 设置 完成 乙 后 将 原 立 方 体 删除 ， 重 新 创建 并 发 布 立方 体 ， 并 且 进 


将 显示 成 功 信息 ， 


Hodel 一 Sales 


Model name: 


[Sales 


General | Description | 


Default category ordering 


(C Yes 
( Ho 
i+ Use the preference setting 


Cube code page: 





图 19-153 ”修改 Cube code page fH 


如 图 19-154 Brzn o 


Publish PowerCube as Data Source and Package 


n 
Bn 





| > flame Status Hessage 
2.2 http Augi a00 ppd Succseded 


图 19-154 ”测试 结果 


返回 到 如 图 19-155 所 示 的 对 话 框 ， 单 击 Finish 按钮 ， 


W Publish PowerCube as Data Source and Package 
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Signon 
Select an authentication method. 


(* All applicable namespaces (including unsecured PowerCubes) 


(^ Restrict PowerCube authentication to a single namespace 
Select whether a cube password is needed. 


厂 Cube password 


[9 Create a signon that the Everyone group can use: 


Password: 


Confirm password: 


Testing 


Test the connection... 

















Cancel | | < Back | 








图 19-155 ”连接 串 设 置 





完成 立方 体 的 发 布 。 


A 


4T 


N 


yl 


| 试 连接 ， 


完成 后 ， 系 统 提示 是 售 进 行 包 的 创建 工作 ， 如 图 19-156 所 示 。 


E Publish PowerCube as Data Source and Package 


一 
1 
M The New Data Source wizard successfully created a data source and a first connection in the Cognos 8 server. 


[4 Create a package 





图 19-156 ”完成 向 导 


单 击 OK 按钮 ， 进 入 新 建 数据 源 问 导 ， 如 图 19-157 PTR. 


有 Publish PowerCube as Data Source and Package 


Specify the name and description - New Package wizard Help 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 
[Sales 


Description: 


Screen tip: 


Location: 
Public Folders 
Select another location... Select My Folders 





| Cancel || < Back || Next > | Finish 











图 19-157 SEZ 





在 Location 下 单 击 Select My Folders， 然 后 单 击 Finish 按钮 ， 完 成 对 包 的 创建 工作 ， 系 统 
弹出 如 图 19-158 所 示 的 提示 框 。 





Transformer essare 


" The data source with the name: Sales 
AJ and the package with the name: '5 ales 


have been created. 





图 19-158 ”提示 框 


人 至此， 使 用 Transformer 建立 多 维 模型 以 及 发 布 立方 体 的 工作 全 部 完成 。 
361 


19.4.3 ”使 用 Analysis Studio 制 作 多 维 报表 


登录 Cognos Connection 控制 侣 ， 选 择 My Folders 选项 卡 ， 如 图 19-159 所 示 。 


Ey Folders 一 Cognos Connection 一 Windows Internet Explorer 





EFEO AHE SEU 收藏 来 &) IAT) R0 


go- B | http://localhost:9300/p2pd/servlet/dispatch?b_action=xts. runêm=portal/cc. xtsêm_tab=i6678B938EE6142C7 V ||4+]| X| | 百度 lef- 


A- D- e- RIBO- GILO- ” 



































w L1 e My Folders - Cognos Connection | 











0 — —LHEININ"TEE 






































(riy Public Folders My Folders | 
My Folders [ms 31 iC 5 Bf && E$ | x S Xr 
Entries: |1 - [2 © IIIDC 
口 | [Names | Modified $ | Actions 
D Gg 产品 销售 区 域 May 25, 2007 3:30:47 PM EST More... 
O Gp 辫 品 销 此 区 域 2 May 25, 2007 2:46:11 PM ES! More... 
完成 | | | @ Internet | i008 ~ E 





19-159 Cognos Connection 控制 台 界 面 


单 击 “ 产 品 销售 区 域 2” 然后 选择 右上 角 的 Launch Analysis Studio 命令 ， 如 网 19-160 
所 示 。 


Ny Folders 一 Cognos Connection 一 Windows Internet Explorer 





THEO RHE SAVU KERA IA AH) 


Go = e http: //localhost:9300/p2pd/servlet/dispatch?b action-xts.run&m-portal/cc.xts&m folder-iA1040920CADE4 M * X | | 百度 P |=] 
: » 
m- - dh o CHAIEQ-UOIBRO- 


53. Query Studio 


: Fe] Analysis Studio 
Um ict B € ISN Report Studio 


o Event Studio 
K& Drill-through Definitions 












































w d Er Folders - Cognos Connection | 












会 7 ev lanh” ? 



















(riy Public Folders My Folders 














| Modified $ 
ne Cognos Administration 


No entries. 








完成 | | © | @ Internet | &100$ ~ ;; 





19-160 Analysis Studio 菜单 
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将 打开 Analysis Studio 工具 ， 如 图 19-161 所 示 。 


— Findows Internet Explorer 





THEO RHO SEO KEKA IA  $eB500 





























~ 
e» € 7 Æ| http: //localhost:9300/p2pd/explore/explore. htm v | 好 | X| | 百度 Pi 
w od EN Folders - Cognos Co... le x| | 从 Z dh - innt F IAO - i 











File Edit View Settings Run Help 


DEHE xe r-F- yiid3-[[E. z-BHB M5-ü- (E 





Show this dialog in the future 








| OK || Cancel | 











| | Internet 9 1008 7 .: 


19-161 Analysis Studio 界面 


选择 Default Analysis. 然后 单 击 OK 按钮 ,Analysis Studio 将 自动 创建 报表 结构 ,如 网 19-162 
所 示 。 


New 一 Ànalysis Studio 一 Windows Internet Explorer 





文件 多) SB) SEV KERA IAT ARA) 


























SAZ v n http://localhost:9300/p2pd/explore/explore.htm bé 好 | | X| | EZ o lz] 
w d Bry Folders - Cognos Co... GA - Analysis Studio X m t z E x | 还 页面 (p- GIA Or 











File Edit View Settings Run Help 
D GEBg xooaeq pr-EK- y-Ex-£52- UEz-B-€. m5. E 


Objects Rows: Columns: Context filter: 
“站 统计 期 > | 引产 品名 称 ~ | 











[gsaies2 
由 -加 统计 日 期 
BS 产品 名 称 
cm 欧式 家 具 26 771 116 | 182 | 1823 | 2918 
cm 地 中 海 家 具 
m 松森 家具 
cm 现代 家 具 956 | 354 452 820 2582 
um 实木 家 具 统计 日 1146 488 558 2379 442 1532 377 632 2643 10197 
m 红木 家 具 
um 中 式 家 具 
Ba 时尚 家 具 
cm 田园 家 具 
日 - 品 地 区 名 称 
cum APA 
zm 
cm A 
um 昌平 
cum 延庆 
cum 东城 
cm 海 证 
日 -图 Measures 
LL 数量 











1146 462 558 652 88 | 1080 261 450 4697 





完成 | | | | | | | Q Internet & 100% ~ 2 
———————UÉER UU ———————————————ÁÀÁ—M—ÁÀ——— —————Á—M——— M—— M———M——ÓÀM M— i 


图 19-162 ”自动 报表 生成 
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将 维度 “地 区 名 称 ” 拖 入 右 侧 家 有 具名 下 方 ， 如 图 19-163 IMR. 


























New * — Ànalysis Studio — Windows Internet Explorer 
LFO RHO EEV KERA IAO 帮助 出 ) 
NI — 
e» 了 Æ| http://1localhost:9300/p2pd/explore/explore. htm "m | 好 | | x | 百度 | [o E | 
D d EME Folders - Cognos Co... FI * - Analysis St... X | em z dh 了 IET m FIRM T 












File Edit View Settings Run Help 
D OEBH xoaa|r-Ei-IY-ZE-(5- DE Z- 图- l i (28 
lisse | 和 产品 名 和 ~ (MEER - | 


Casi ERR 
日 -早产 品名 称 
um 欧式 家 具 
um 地 中 海 家 具 2009 | 
" | 
- ipi 2000 780 366 1146 462 462 | 295 
um 实木 家 有 具 E | | | 
cm 红木 家 具 780 366 1146 462 26 488 295 2 
mm 中 式 家 上 qo | | | [ee | | | mm 
5 时 尚 家 有 具 
cum 田园 家 具 
日 时 地 区 名 称 
cum 朝阳 
cm 
um 
um 昌平 
cum 延庆 
cum 7i 
Um ur 
日 -图 Measures 
LER 











^ 



































3 ®© 


iis M Far Left « Page Left P Page Right 





Information -地 区 名 称 Ce 


EUENE 


di 
3 
© 
3 


图 19-163 多 表 头 设置 
然后 右 击 “地 区 名 称 ”， 将 其 隐藏 显示 ， 如 图 19-164 PTR. 




















New + — ånalysis Studio -— Findows Internet Explorer 
THEO AE EEV RERA IAM 帮助 加) 
SAZ) z E http://localhost:9300/p2pd/explore/explore. htm v | | 好 | x | 百度 | P |=] 
w d Ew Folders - Cognos Co... LI * - Analysis St... X I] ta X dah X cr mE C - 这 工具 加) 2 m 











File Edit View Settings Run Help 


D GEB xoweqa|r-Ei-|Y-ZE-d£50- e)l M) 8 








Rows: Columns: Context filter: 
mee | |frasm fake. 

各 统计 日 期 

日 -早产 品名 称 
um 欧式 家 具 
cm 地 中 海 家具 
m 松木 家 有 具 
cm 现代 家 有 具 
um 实木 家 具 
m 红木 家 具 
um 中 式 家 具 
Ba 时尚 家 具 Sort 
mi M Calculate 

jm 
cum APA Suppress Rows 
um F 
um 大 兴 
um 昌平 
cum 延庆 
cum 东城 
Um RUE 

3 P Properties (地 区 名 称 ) 



























大 3 









































s ® 


sis M Far Left « Page Left P Page Right 


Information - M £j A X 


完成 IL] DL L j|] linen | Qı% ~ ,; 
一 一 





图 19-164 ”隐藏 操作 
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最 终 效 果 如 图 19-165 PZR. 





XR sq Wo REZU IRP WR 0p 








Pom -= = i 一 
^ 2 Ey - e. http IH 1lecalbost .8300/92p d/ explere/explore. hte MAT bad 








X 
*« (9 ia rers ~ Comes Cs [de * = Malysis St., X LE a-e- -DXx0-:0120- " 








DocBgxnoedSb:F- TE). 

sae: < gritam- ÍF&&W ~ 着 地 区 和 名称 ~ | ^ 

Tr EXE 地 中 海 家 只 HER 
NE NIB Té XX BT EX TM ONGME Te XX BF ER RMONG[NR TS XX BF ER 
umi EA 26 
mc 
wE 
"RA NS | | 
cm 可 本 灰 具 789 366 462 426 295 263 


cm "PSI PN «|. EE » 
mA a 


= [4E R 
日 "dcm 
cm 0850] 
cmi 
cm eM 
AT 
m SEI 
cm RU 
cm gU 
- 加 ww 


Lr 














7n job 262 295 el 


Information -AKES AT 
EL | Lost! Qd internet | RIS * 
——————————————u-'' ÓáÁW' OÁW——A———!—'—-—'—— A! A——————— AÍÓr— 


19-165 ”效果 图 
19.4.4 ”查看 报表 


单 击 “ 运 行 ”按钮 了 -~， 在 弹出 的 下 拉 列 表 中 选择 了 P》 anettemy | 选项 ， 
AUR Ul 19-166 所 示 。 





Yi ag Eq kwaw 工具 I] Meo 











G- ~ P http://localhost: 8300/p2pd/servlet/ di spateh &ii*eix| [Es leis 
|f-— ne pp Mm Amen (Om PRI Mgmt e v pons OECD 一 Ls 
* k (Emi my Folders ~ Cognos Co... Bh- Analysis Studio A Cognos Viewer x | ü- mco REO GIRO ， 








| EN !it 6B | 加 -| 
EA 

ERr T ITI ii MTE i ł iE ET ATLE 
-E 366 462 2€. 26 ES? Ba :0a0 
EM D I | | | LIEN EE | | E- | 
en 780 366 462 26 2295 263 456 485 652 286 88 354 1080 
D 
Mun £i 


00 Qisu | uw * 2 





19-166 ”运行 报表 


显示 的 
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19.5 本章 小 结 


1) Cognos 的 安装 分 为 : 服务 器 安装 、Framework 3%. Transformer 安装 、PowerPlay 安 





2) Cognos 部 午前 需要 进行 相关 的 设置 ,将 程序 部 著 到 Cognos Hif] Tomcat Jk 452821 
发 布 。 

3) Cognos 启动 的 方式 有 两 种 。 一 是 在 Cognos Configuration F, $h TRP H P 按钮 
启动 ， 二 是 在 Windows 服务 中 ， 选 择 teos 8 选项 启动 。 
4) 本 章 还 介绍 了 使 用 Framework 建 模 与 Transformer 立方 体 多 维 建 模 的 步骤 。 
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第 20 章 ”Cognos 实 例 


本 章 目标 

前 面 几 章 ， 学 习 了 Cognos 的 工具 介绍 、Cognos 的 安装 与 快速 使 用 ， 接 下 来 本 章 将 介绍 
儿 种 沼 用 的 报表 类 型 开发 。 

学 习 本 半 后 ， 您 将 掌握 : 

€ Section 报表 的 开 友 。 

€ Conditional Style 报表 的 开发 。 

€ Chart 报表 的 开发 。 

€ Drill-Through 报表 的 开发 。 














20.1 Section 报 表 的 开发 


Section 报表 可 以 将 分 组 的 字段 以 分 块 的 形式 展示 给 用 户 ， 展 示 清 晰 、 不 易 造 成 混乱 。 
Section 报表 的 应 用 很 多 ， 比 如 工资 条 就 是 以 这 种 方式 统计 并 打印 出 来 的 。 接 下 来 为 大 家 展示 
一 个 简单 实用 的 Section 报表 开发 实例 。 

首先 使 用 Framework 制作 模型 实例 ， 制 作 好 的 模型 如 图 20-1 所 示 。 


-a Sales2 一 Framework anager 

















File Edit View Diagram Project Repository Actions Tools Help 

[3| eH X | E-A Em d 

4mBack Tt F ||salesz > BI_TARGET k| & 1005 - Z ci e mi "E 

roject Viewer $2 Explorer ge Diagram | 四 Dimension Map Tools nx 


fj Summary |f] Search &, Dependencies 


Select an object to view its dependencies 





(iE SALES A 














+ pER 
- (Gi) Pack 


ages 
& LIE 
Dependent objects 
P Dx 
Properties | Language 
Hame BEE 2 ^ 
Description 1 
Last Changed 2007-05-25T15:44:09 
Last Changed Br Anonymous 
Model Comments 
Screen Tip 
Last Published 2007-05-25T15:44:03 
Last Publish Location Directory > Cognos > Anonymous > My ... 
Max Versions 0 
一 Languages «Click to edit.» Ly 
| E p odar | Definition «Click to edit.> 
Is Role Based false wi [^ Show Object ld 
完成 


图 20-1 模型 图 


然后 打开 Cognos Connection， 选 择 友 布 好 的 包 “ 产 品 销售 区 域 2”， 选择 Query Studio 命 
令 进入 到 报表 页 面 ， 如 图 20-2 Br. 
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Ey Folders 一 Cognos Connection 一 Windows Internet Explorer 





FEO 编辑 于) EEU KEKA IAT)  $B500 


GO m rn http://localhost:9300/p2pd/servlet/dispatch?b action-xts.run&$m-portal/cc.xtz&m folder-i66T8B938EEB14 V 好 | | X | BE o |z 























、 ^ » 


Ec d- XED-IAO- 
DE é(——3A 0 55 HTILMEMEDMI Mi 


N Query Studio 
Fe] Analysis Studio 
"ES b Report Studio 
eo Event Studio 
Kj Dril-through Definitions 


w d e My Folders - Cognos Connection 




















(riy Public Folders My Folders 


My Folders E 












































口 | | Modified $ 
口 Gp 产品 销售 区 域 May 25, 2007 3:30:47 PM 
口 转产 品 销售 区 域 2 May 25, 2007 3:44:09 PM More... 


| lame $ 





PY Coanos Administration 
T 








dil 
3 


| &^ Internet | ^ 1008 aur 





图 20-2 控制 合 界面 
进入 Query Studio 报表 开发 工具 后 ， 在 Insert Data 菜单 下 ， 将 查询 项 “统计 日 期 ””“ 产 


品名 称 ”“ 地 区 名 称 ”“ 数 量 ” 依 次 选择 , 并 单 击 下 方 的 Insert 畦 控 钮 插入 到 右 侧 的 工作 区 中 ， 
如 图 20-3 所 示 。 

































































New — Query Studio — Windows Internet Explorer l- lE) 
TEO RO) SEU RERA IAT $8B500 
Go v |É|http://localhost:9300/p2pd/servlet/dispatch v | 好 | | X | BE |o |=] 
w d Æ Nen - Query Studio | | 从 z : dah * | 小 页 面 E) - GIAO > n 
Men — [gb DG Hà 5 &xoop Y 2 z Bi sss Fh- lu ds c dm c ES RB m 
Tena FAEERE 
Edit Data 
Change Layout Title = 
Run Report 
Manage File 统计 日 期 产品 名 称 | 地 区 名 称 o uà 
国产 品 销售 区域 2 Mar 20, 2009 12:00:00 AM 中式 家 具 WE 116 
=- Wi SALES Apr 1, 2009 12:00:00AM — MARA “海淀 286 
(M o May 20,2009 12:00:00 AM 时 尚 家 具 ”平谷 182 
加 产 品名 称 Aug 31, 2009 12:00:00 AM 现代 家 具 — XX 485 
TARAH Sep 30, 2009 12:00:00 AM MARA ”朝阳 1,823 
Lipice Nov 18, 2009 12:00:00 AM | 地 中 海 家 具 平谷 26 
Hag Jan 31, 2010 12:00:00 AM 时尚 家 具 — HRUE 450 
8p 统计 日 期 May 13,2010 12:00:00 AM RARA “朝阳 780 
May 20, 2010 12:00:00 AM 松林 家具 — XX 263 
Sep 15,2010 12:00:00 AM 中式 家 具 ”延庆 261 
Oct 1, 2010 12:00:00 AM RRRA “朝阳 88 
Oct 1, 2010 12:00:00 AM ”松木 家 具 ”朝阳 295 
Oct 16, 2010 12;00:00 AM ”现代 家 具 S 652 
Nov 22,2010 12:00:00 AM ARRA Ri 366 
Dec 20, 2010 12:00:00 AM ， 地中海 家 具 朝阳 462 
Dec 31, 2010 12:00:00 AM 红木 家 具 SAPA 1,080 
Jan 1, 2011 12:00:00 AM “现代 家 具 “朝阳 956 
May 1, 2011 12:00:00 AM. RRRA 8 354 
May 10,201112:00:00AM HARA Kiii 452 
Jul 21 2011 12:00:00 AM. MARA — 820 gl 
||| | O tenet | R100% ~; 


20-3 Query Studio 报表 制作 
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选择 “数量 ” 列 中 的 数据 ,然后 单 击 Text Alignment 投 钮 国 -， 选 择 Align Top Center 选项 ， 
将 其 设 为 大 中 显示 。 
接 看 调整 日 期 格式 ， 选 中 “统计 日 期 ” 列 中 的 数据 ， 选 择 表 单 Edit Data 下 的 Format Data 
命令 ， 随 后 弹出 Format data 域 ， 如 图 20-4 所 示 。 
Fomaetdata | 


Specify how you want the data to appear. Choose Default format to revert to the original format. 


Category: 


Default v 





| ok || cance | 





20-4 Format data 域 
在 Category 下 拉 列 表 中 选择 Date， 在 右 侧 出 现 的 Type 下 拉 列 表 中 选择 “19/08/2003” 选 
项 ， 如 图 20-5 所 示 。 


Specify how you want the data to appear. Choose Default format to revert to the original format. 

















Category: Type: 
Date s 
19 Aug 2003 
19 August 2003 


Tuesday, 19 August 2003 























OK Cancel 








20-5 日 期 格式 化 
单 击 OK 按钮 ， 完 成 日 期 格式 化 ， 如 图 20-6 所 示 。 






studia Firidlows Internes? Explorer 


xir Go FEW PAW IAT EOD 











oo > mmn sS xi [rm —— Jai 
Ur WE MÜ Rer ry Studis "tl ae Gnn. HIRA 
(m | B [Pom i 
| Fia data | 
icii Listul i | 
Marge Fig | [amm FAsh Eis] A |] 
Y tes imis  qVEXEA iA T) 
| E ajos HEFJA AF di 
[A$ sana imus MAFA Tu 181 
B Gand ajena MEFA — Xxx ads 
WE EpmeiDete,,. ax MEJA WW LAN 
B uus. iios APGA Ru 26 
ERES iain HAFA — MEA a 
dh ipsas sig BAFA HA D 
{h rip mahi EGER XX PT 
ER alu &niun PAFA HE mi 
cun SAFA BR p 
acu Qut EpL vous o HERE TH ET 
ya —0 w0|Ne x MEFA EF 人 
rl. 二 uero BARA Fal w 
UM Dew zuo MOTHREERL WEJ zi 
m? ux Haya ADEER MA Ln 
Cw Sed 11 GmEXHR Ma bia 
sii zIEA Bf E 
Aran ALTER FE ati 
3 mEETA FM x 


a | 





图 20-6 格式 化 后 的 日 期 
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接 看 进行 分 段 设置 ， 选 中 “产品 名 称 ” 列 名 ， 然 后 选择 亲 单 Change Layout 下 的 Create 
Sections 命令 ， Query Studio 将 目 动 进行 分 段 ， 效 果 如 图 20-77 PR o 
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图 20-7 Section 报表 
人 至此， 完成 了 一 个 完整 的 Section 报表 的 制作 。 


20.2 Conditional Style 报 表 的 开发 


在 Conditional Style 报表 中 ， 符 合 条 件 的 数据 可 以 突出 显示 。 例 如 ， 当 前 茶 产 品 的 销售 额 
AT 10775 AKIR, MAUS, 背景 色 为 红色 ， 子 体 为 绿色 、 加 粗 。 

本 节 将 演示 一 个 Conditional Style 报表 的 开发 过 程 。 

首先 使 用 Framework 制作 模型 实例 ， 制 作 好 的 模型 如 图 20-8 所 示 。 
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然后 打开 Cognos Connection， 选 择 发 布 好 的 包 ， 在 选择 Report Studio 进入 到 报表 页 面 ， 
如 图 20-9 所 示 。 
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20-9 ”控制 台 界 面 


进入 到 Report Studio 报表 开发 页 面 后 ， 依 次 将 得 询 项 “统计 日 期 和 “产品 名 称 和 “地 区 
名 称 ”“ 数 量 ” 拖 入 到 右 侧 的 工作 区 中 ， 如 图 20-10 所 示 。 
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20-10 报表 设计 
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Tati ÉLfEPCRUAR E077, JG PaEDUSELRUEETPUI "Jar os". RE KIRE ER, 
如 图 20-11 所 示 。 
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20-11 居中 设置 


单 击 “ 数 量 ” 列 下 方 的 “< 数量 >” 项 ， 此 时 工作 区 样式 


< 统计 日 期 > < 产品 名 称 > < 地 区 名 称 > AE 


如 图 20712 所 未 。 < 统计 日 期 > < 产品 名 称 > < 地 区 名 称 > < 数量 > 
Tt fat Conditional Style Z4 Bl ,随后 弹出 Conditional < 统计 日 期 > < 产品 名 称 > < 地 区 名 称 > -数量 > 
Styles〈 条 件 样式 ) 对话 框 ， 如 图 20-13 所 示 。 20-12 选择 “数量 ”后 的 效果 图 


和 Conditional Styles Help 


ED 





20-13 Conditional Styles 对 话 框 
Ta "gp BEBE. Ea E New Conditional Style 命令 新 建 一 个 样式 ， 
如 图 20-14 所 示 。 
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New* — Report Studio — Windows Internet Explorer 
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20-14 ”新 建 样 式 


选择 “数量 ”选项 ， 然 后 单 击 OK 按钮 ， 弹 出 Conditional Style-Numeric Range 对 话 框 ， 
如 图 20-15 所 示 。 
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20-15 Conditional Style-Numeric Range 对 话 框 


单 击 图 20-15 中 的 “新 增 ” 按 钮 匿 ， 设 置 一 个 范围 值 ， 比 如 500， 如 图 20-16 所 示 。 


395 
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20-16 设置 范围 值 


然后 单 击 OK 按钮 ， 此 时 Conditional Style-Numeric Range 对 话 框 变 更 ， 如 图 20-17 所 示 。 
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20-17 Conditional Style-Numeric Range 对 话 框 发 生变 化 
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设置 目标 是 : WR MUR" KF 500 人 ， 则 样式 更 改 为 背景 色 是 下 色 、 子 体 闫 色 是 红色 、 
加 粗 字 体 。 单 击 图 20-17 中 最 上 方 的 “编辑 ”按钮 ， 弹 出 Style 样式) 对 话 框 ,如 图 20-18 
B. 
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20-18 Style 对 话 框 


设置 完成 之 后 ， 范 围 设 置 对 话 框 显示 如 网 20-19 所 示 。 
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20-19 新建 样 式 
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此 时 Conditional Styles 对 话 框 中 显示 为 一 个 条 件 ， 如 图 20-20 所 示 。 
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单 击 OK 按钮 完成 条 件 样 陈 的 设置 。 运 行 报表 ， 凡 是 “数量 ”大 于 500 AEA 


图 20-20 Conditional Styles 对 话 框 











显示 为 贡 色 、 子 体 磊 色 为 红色 、 并 且 加 粗 显 示 凶 体 ， 如 图 20-21 所 示 。 
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图 20-21 报表 效果 图 


人 至此， 完成 了 一 个 Conditional Style 报表 的 制作 。 


20.3 图 表 型 报表 的 开发 











本 H An 


图 表 型 报表 ， 以 其 表达 明确 、 方 便 答 看 、 对 比 清晰 等 特点 被 很 多 的 决策 管理 者 在 工作 中 





使 用 ， 因 此 ， 本 节 将 对 如 何 创 建 图 表 型 报表 做 一 个 人 简单 的 演示 。 
首先 ， 使 用 Framework 创建 一 个 模型 ， 如 图 20-22 所 示 。 
396 


7: Sales2 + — Framework ts PREJIE 


| File Edit View Diagram Project Repository Actions Tools Help 


[D|B H| Ww cs | X aax | a- mea 








| Back DForward | Y F ||5a1les2 > BI_TARCET || k| « oo- Eg 5E #4 C5 E m a 
Project Viewer iz Explorer ge Diagram | 四 Dimension Map [ Tools xl 
E (a Sales2 tj Summary 名 Search & Dependencies | 


Select an object to view its dependencies 














日 BI TAECET 


Drag & drop an object from the Project 


Viewer here to view its dependencies 





He 统计 日 其 
© Data Sources 
Parameter Maps 
(iJ Packages 








+) F 














1] 








Dependent objects 





Properties 0000000 y y x] No Dependencies Found 


Properties | Language 

Hame 产品 名 此 区 域 2 

Description 

Last Changed 2007-05-25T14:46:11 

Last Changed By Anonymous 

Model Comments 

Screen Tip 

Last Published 2007-05-25T14:46:11 

Last Publish Location Directory > Cognos > Anonymous > My ... 

Max Versions 0 

Languages «Click to edit.» P 

T p oA aF Definition «Click to edit. > 
Is Role Based false ~“ 
zs E JN 

















20-22 ”模型 图 
接 下 来 ， 打 开 Report Studio 工具 ， 新 建 报表 类 型 时 选择 Chart 报表 ， 如 图 20-23 所 示 。 
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20-23 ”报表 类 型 图 


单 击 OK 按钮 ， 在 图 表 类 型 中 选择 Column， 如 图 20-24 所 示 。 
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20-204 图 表 类 型 图 


单 击 OK 按钮 ， 开 始 创建 图 表 型 报表 。 此 时 的 Report Studio 显示 如 图 20-25 所 示 。 
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20-25 Report Studio 界面 


具体 步骤 如 下 : 
1) 将 Measure 下 的 “数量 ” 拖 入 到 工作 区 的 Default measure (y-axis) 中 ， 如 图 20-26 


了 96 


所 示 。 
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2) 将 “地 区 名 称 ” 拖 入 到 右 侧 工作 区 的 Series 中 ， 如 图 20-27 所 示 。 
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3) 将 “产品 名 称 ” 拖 入 到 右 侧 工作 区 的 Category (x-axis) F, WB] 20-28 PR. 
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mbers here to create page layers ^ Drop members here to create a context filter (slicer) 
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Double click to edit text 
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日 -图 Xe M Category (x-axis) 
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@ Internet & 100 ~ 
图 20-28 横 轴 设置 

4) 单 击 Axis titles 前 面 的 “+” 号 将 其 展开 ， 如 图 20-29 所 示 。 

5) 双击 横 看 的 abe 图 表 后 的 学 体 ， 输 入 “产品 名 称 ”， 如 图 20-30 所 示 。 


产品 名 称 





2lil Double click to edit text 





图 20-29 ”标题 设置 图 20-30 输入 框 





6) 双击 竖 看 的 abc 图 表 后 的 字体 ， 输 入 “数量 (单位 : EU. 设置 好 的 Axis titles 如 
图 20-31 所 示 。 

7) 在 Insertable Objects 窗口 中 单 击 ToolBox 选项 卡 ， 将 Query Calculation 组 件 插 入 到 右 
侧 工 作 区 的 Axis titles 下 设置 好 的 “数量 (和 单位 ， 套 )” 后 面 ， 在 弹出 的 Create Calculation 所 
示 框 中 输入 Name 值 为 total， 如 图 20-32 所 示 。 


E Axs titles: Create Calculation 
Name: 


E PRSE E 
J g (单位 : 套 ) OK 


20-31 标题 20-32 输入 Name fH 
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8) "4E OK 按钮 ， 在 随后 弹出 的 Data Item Expression 对 话 框 的 Expression Definition X: 
本 框 中 输入 “total([ 数 量 )”， 然 后 单 击 上 方 的 “验证 ”按钮 进行 表达 式 验证 ， 无 误 后 显示 如 
图 20-33 所 示 。 
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EB calculated Memt 日 -图 Measures 
RA Calculated Measure i BE 
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© Conditional 

Conditional Styles S8 T mi T Tips | Errors 

Style Variable 
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20-33 ”计算 式 设置 
9) "i OK HL 最 后 设计 好 有 的 ARERR 20-34 所 不 。 





图 20-34 工作 区 
10) 保存 后 单 击 “运行 ”按钮 ， 最 终 效 果 如 图 20-35 所 示 。 
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2,000 地 区 名 称 


B 平谷 
B 东城 
1,600 B 大 兴 
B 延庆 
E: H ay 
g Bum 
二 1,200 5 
u 
i 
8 
— 800 
E] 
Ez 
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0 
红木 家 具 MERA ”时 尚 家 具 ”松木 农具 ”中式 家 有 具 MARA 地 中 淘 家 具 实木 家 具 MERA 
产品 名 称 


图 20-35 ”运行 报表 
到 此 为 上 上 ， 完 成 了 一 个 完整 的 图 表 型 报表 的 开发 实例 。 





20.4 ”Drill-Through 报 表 的 开发 


使 用 Drill-Through 访问 ， 可 以 在 一 个 会 话 范围 内 从 一 个 报表 跳 转 到 另 一 个 报表 。 比 如 ， 
可 以 从 一 个 产品 的 销售 报表 跳 转 到 该 产品 的 风险 报表 ， 也 可 以 从 一 个 企业 成 本 统计 报表 跳 转 
到 某 成 本 的 明细 报表 。 

与 单一 报表 相 比 ，Drill-Through 可 以 帮助 用 户 整 合 业 务 应 用 ， 将 多 个 报表 紧密 地 联系 在 
一 起 ， 最 大 程度 地 多 方位 了 解 企业 业务 。 

1. 使 用 Framework 创 建 数据 模型 

使 用 Framework 制作 模型 在 这 里 就 不 做 过 多 的 介绍 ， 制 作 好 的 模型 如 图 20-36 所 示 。 
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图 20-36 模型 图 
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2. Cognos Connection}; FERRIE ILA] 20-37) 
3. 使 用 Report Studio 创 建 详细 列表 信息 页 
首先 创建 一 个 List 报表 ， 如 图 20-38 所 示 。 
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C pid ELI CIEN 
20-37 Wa 20-38 ”报表 类 型 


将 Insertable Objects 中 “产品 销售 区 域 2” 查 询 主题 下 的 “统计 日 期 “产品 名 称 ”“ 地 


区 名 称 “ 人 “数量 ”依次 拖 入 右 侧 工 作 区 中 ， 如 图 20-39 所 示 。 


HNew* 一 Report Studio 一 Windows Internet Explorer 
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Conditional Styles 
Style Variable 
ij Box 














20-39 设置 报表 


接 下 来 ， 打 开 Query Explorer 视图 ， 双 击 Queryl1， 如 图 20-40 所 示 。 
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New* — Report Studio — Windows Internet Explorer 
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20-40 Query Explorer 视 


在 视图 中 将 Data Items 中 的 “产品 名 称 ” 拖 入 右 侧 的 Detail Filter 工作 区 中 , 在 Expression 
Definition 下 的 文本 框 中 输入 “|[ 产 品名 称 ]=?cpmc?”， 如 图 20-41 所 示 。 





New* — Report Studio — Windows Internet Explorer 
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20-41 表达 式 设 置 
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Ii AEA "Sub" TRIB. EAER, XeBR— T EAA FA) 
ik OK 按钮 ， 如 图 20-42 所 示 。 








二 http://localhost:9300/p2pd/servlet/dispatch — Windows Internet Explorer 
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Provide values for the report you are about to run. 
** Indicates a required field. 


> Points to missing information. 


产品 名 称 

Provide a value: 
* | 中 式 家 具 M 
产品 名 称 

















| 中 dB 





完成 @ Internet & 1008 ~ 
图 20-42 “产品 名 称 ” 设 置 


接着 使 用 同样 方法 ， 将 Data Items 中 的 “地 区 名 称 ” 拖 入 右 侧 的 Detail Filter 工作 区 中 ， 
在 弹出 的 窗口 表达 式 定义 中 输入 “[ 地 区 名 称 ] in ?dqmc?”， 然 后 单 击 右上 角 的 “验证 ”按钮 
辆 ， 在 弹出 的 页 面 中 ， 选 择 所 有 7 种 方式 ， 然 后 单 击 OK 按钮 。 最 终 完 成 的 Detail Filters 
如 图 20-43 所 示 。 





[地 区 225 $5] in 2dgmc? 





图 20-43 SEXAS Detail Filters 





然后 单 击 Page Explorer 中 的 Pagel 页 面 ， 回 到 页 面 设计 工作 区 ， 如 图 20-44 所 示 。 
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Conditional Styles 
Style Variable 
SS Box 














完成 |. | rt | Q Internet | &100$ ~ ,; 
20-44 Report Studio 设置 
接 下 来 ， 将 “产品 名 称 ” 和 “地 区 名 称 ” 分 组 ， 并 且 居 中 显示 ， 将 List 靠 左 排列 ， 将 其 
名 称 改 为 “报告 如 下 :” 修改 Double click to edit text 为 “产品 销售 区 域 报告 ”%” 最 后 ， 保 存 为 
“产品 销售 区 域 报 告 ”%” 效果 如 图 20-45 所 示 。 
产品 销售 区 域 报告 








20-45 工作 区 设置 
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4. 使 用 Report Studio 创 建 主 页 
用 次 似 前 面 的 步骤 创建 一 个 List 报表 ， 将 “产品 名 称 ” 和 “地 区 名 称 ” 拖 入 到 列表 中 ， 
如 图 20-46 所 示 。 保 存 为 “产品 销售 区 域 汇 总 表 ”。 
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图 20-46 “产品 销售 区 域 汇 总 表 ” 设 置 
5. 制作 Drill-Through 报 表 


在 “产品 销售 区 域 汇总 表 ” 中 , 右 击 “< 产品 名 称 >”, 在 弹出 的 快捷 荣 单 中 选择 Drill-Through 
Definitions 命令 ， 弹 出 如 图 20-47 所 示 的 对 话 框 。 


X Drill- Through Definitions 
Drill-Through Definitions: 








No Selection 











B ae X 








20-47 Drill-Through Definitions 对 话 框 
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AmE, Gg—^* Drill-Through 定义 ， 如 图 20-48 所 示 。 


^ Drill-Through Definitions 


Drill-Through Definitions: 
+ Drill-Through Definition 1 











20-48 Durill-Through 定义 对 话 框 


单 击 Target Report 选项 卡 中 的 Report 右 侧 的 |…| 按 钮 ， 在 弹出 的 对 话 框 中 选择 “产品 销售 
区 域 报告 ” 如 图 20-49 所 示 。 
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20-49 Drill-Through 链接 对 话 框 
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然后 将 Action 的 值 改 为 Run the report, Format 的 值 改 为 HTML， 如 图 20-50 所 示 。 
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Conditional Styles 
Style Variable p ae X 
Text Source Variable 














完成 | | | | | @ Internet | Q100% ~ FE 





20-50 Drill-Through 定义 对 话 框 
Hsu, TES WE. cpme 对 应 的 Method 值 为 Pass data item value, Value 值 
选择 “产品 名 称 ”，dgqmc 对 应 的 Method 值 为 Pass data item value, Value 值 选择 “地 区 名 称 ”， 
如 图 20-51 所 示 。 


























New* — Report Studio — Windows Internet Explorer l- efx) 
THO SE ”查看 (W) KEXA IAM 帮助 加) 
e» € 了 Ø| http: //localhost:9300/p2pd/pat/rsapp. htm v *r||x| | 百度 | M 























Æ nex - Report Studio X 关 产 入 区 域 报 省 = Rp | | e M 人 z ETT E Z IAQ a? 


File Edit View Structure Table Data Run Tools Help | 


* Ll ES MITT Folders - Cognos Co... 














D BHixSga-m xiocitmp -[alb-ie- tis IY H-H- z- Bi 8 B i - Lg 6 EN E? 
[Font -[e i-um Ak MEIA 






























































Drill-Through Definitions: 
+ Drill-Through Definition 1 Target Report | Bookmark | Label 
c Is] 产品 销售 区 域 2 | | | | —————| 
Report: 
c WU SALES 
T [EBSEEDUHRE | 
W w Parameters Help X | 
Len z 
d Ese cpmc String v Pass data item value [| 国 产品 名 称 [>] 
np damc String v Pass data item value | 国 地 区 名 称 T 
E it E 
S tou 
A OK || Cancel 
吕 Conditional Only when required parameter values are miss v 
Conditional Styles 
Style Variable [p ale x 
Text Source Variable d 
| œx || Cw | 
E Ef Date [31 (9 Time 











20-51 Drill-Through 变量 设置 对 话 框 
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最 终 完成 的 Drill-Through Definitions 对 话 框 的 设置 如 图 20-52 所 示 。 











C News Krport Studio Windows internet Explorer 


wp sg) Xo) WX IA Wn 


一 一 一 一 一 


Dy oy = E http .11localhest:93001T2palgatjrsapy hta ee EE | ei 
Xr 家 [eme dia, Padus - Copes Co... gem - Ropart Studio Xo RE PREMBBQUMUKIE - Bap.. R- D €-j^&o-QIao-" 
féc tdk View Shmwciure Table Oats Rum Toob Help x 
DEH taxa Aa -WA t 7T 98-0: z-B- cas cx dt wi? 

[enr i; zl -| | 和 -| NA | Through pr = ES z " m 5 " FEILET 

















a 
= Conditional 
Condouns Styles 
sty yanscie 
Text Source Vansole 





BER Date @ Time 


prd @ Internet 或 1008 * - 
[-——————————————————————————ÀÓÉEEEÉEEBBÓBÓBÉÓBÓÉÓBÓÓÓODODEMEDEDDESGODDLIRBQOEROEILLLIEAELAALMA?AGSOO VALS] 


20-52 Durill-Through Definitions 对 话 框 


单 击 OK 按钮 完成 Drill-Through 的 配置 ， 然 后 保存 报表 。 
单 击 Run Report 按钮 ，Report Studio 将 运行 报表 “产品 销售 区 域 汇 总 表 ” ü 20-53 
所 示 。 


TERA ”朝阳 
EARRA 朝阳 
HARA FË 
JERA | Atih 
榨 相 家 有 具 | AP 
PERA ”延庆 
田园 家 有 具 朝阳 
MARA | S 

MAREA AA 
地 中 海 家 有 具 ”朝阳 
田园 农具 东城 
PEREA 海 证 
KERA 朝阳 
ERARA | zii 
ERARA 朝阳 


地 中 海 家 有 具 CR 
现世 农具 海 证 
栏 相 家 有 具 朝阳 
XERA aF 
时 尚 家 有 具 | E 


20-53 ”运行 报表 
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Y “nr HO Jp» 2S €é Y » 


统 将 跳 转 到 as 品 销售 区 域 报告 ” WJA o TVA IRI PT) HRS CUM Aug 31, 2008 12:00:00 AM | 485 


信息 如 20-54 所 示 。 昌平 Oct 15, 2010 12:00:00 AM | 652 
> y 。 朝阳 11, 12:00: | 

到 此 为 止 ， 完 成 了 一 个 完整 的 Drill-Through MM ee st Ms 

海 证 Apr 1, 2009 12:00:00 AM 286 


实例 。 
图 20-54 跳 转 页 面 


20.5 ”本 章 小 结 





1) Cognos 实例 开发 包含 列表 式 、 图 表 式 、 地 图 式 、 罗 可 式 等 。 
2) Section 报表 的 开发 在 业务 需求 中 经 常会 们 到 ， 本 革 介 绍 了 该 报表 的 开发 过 程 ， 使 用 


比较 多 的 用 户 包 括 税务 部 门 。 
3) Conditional Style 报表 将 符合 一 定 条 件 的 数据 用 高 完 或 者 其 他 醒目 的 方式 显示 出 来 ， 


其 特点 十 突出 、 明 了 。 
4) 图 表 型 报表 ， 以 其 表达 明确 、 方 便 查 看 、 对 比 清晰 等 特点 被 很 多 的 决策 管理 者 在 工作 


中 使 用 。 
5) Drill-Through 报表 可 以 退 踊 业务 的 明细 或 者 更 局 层级 的 统计 信息 ， 方 便 用 户 动 态 地 显 


示 业 务 ， 有 助 于 对 业务 数据 进行 分 析 决 策 。 
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782138 Cognos 的 安全 管理 


本 章 目标 

本 章 主 要 介绍 了 Cognos 的 安全 管理 ， 包 括 应 用 防火 墙 、 吴 份 验证 、 访 问 授 权 等 。 
学 习 本 革 后 ， 您 将 掌握 : 

€ Cognos 的 安全 性 涉及 的 内 容 。 

€ Cognos 的 安全 部 普 内 容 。 

€ Cognos 的 安全 实践 内 容 。 














21.1 Cognos 安 全 性 介绍 











Cognos 的 安全 性 可 以 满足 不 同 的 用 户 安 全 需求 。Cognos 提供 了 一 组 灵活 的 、 可 与 现 有 系 
统 安 全 模型 进行 兼容 的 安全 架构 ， 如 图 21-1 所 示 。 它 可 以 很 容易 地 与 第 三 方 号 份 验证 和 加 密 
技术 集成 商 进 行 整合 。 

Cognos 的 安全 性 涉及 以 下 几 点 : 

€ Cognos VH] E; Kk. 

€ Cognos 身份 验证 。 

€ Cognos 访问 授权 。 

€ Cognos 加 密 服 务 。 



























Cognos 用 户 界面 基于 Web、Windows 的 界面 
& 网 络 防 火 墙 ” 一 一 一 一 - ——— 
E 第 一 层 Web 服务 
E 
网 络 防 火 墙 ——— —. 
E senem Cognos 应 用 防火 墙 
E 第 二 层 应 用 Cognos 服务 
网 络 防火 墙 一 一 E a E 
第 三 层 数据 7] 


图 21-1 Cognos 安全 架构 


21.1.1 Cognos 应 用 防火 墙 


在 Cognos 安全 架构 中 ,Cognos 应 用 防火 墙 (CAF) 是 不 可 或 缺 的 组 件 , 用 来 帮助 Cognos 
抵御 外 来 恶意 数据 的 攻击 ， 比 如 绥 存 溢出 和 跨 站 脚本 攻击 。 默 认 情 况 下 ，CAEF 将 启用 ， 并 且 
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不 能 被 茶 用 。 
Cognos 应 用 防火 声 在 Dispatcher 层 对 进出 流量 进行 验证 和 过 小 ， 如 图 21-2 Br. 


Cognos Configuration — liugf DBR) 


Fie Edit View Actions Help 





—— Cognos Application Firewall - Component Properties 


E Local Configuration 
| ci ts Environment 
B Cognos content database 
e 外 Logging 
. i (| File 
g- Cognos 8.. 
| L “区 Eon 8 
: E Portal Services 
-E Paid 
g- Authentication 
Pob [t] Cognos 
E 中 Cryptography 
: a . Cognos 
| oL Cognos Application Firewall 
[Bo Data Access 
3 W Content Manager 
|: [fg] cognos 
frg] Notification 
a-ig Cognos Planning 


D ———— i — 


* Enable CAF validation? True 
Valid domains or hosts «click the edit button 
Is third party X55 checking enabled? False 
Third party X55 characters c» 


Defines a group of properties to configure the Cognos Application Firewall. 


The Cognos Application Firewall is an essential component of product security 
helping to provide protection against penetration vulnerabilities. Disabling the 
Cognos Application Firewall will remove this protection; therefore, this should not be 
done under normal circumstances. 








- IH Contributor Data Server 








图 21-2 Cognos 应 用 防火 墙 


21.1.2 ”身份 验证 


Cognos 8 的 吴 份 验证 是 由 第 三 方 喘 份 验证 提供 程序 进行 管理 的 ， 可 以 用 于 定义 组 、 用 户 、 
角色 ， 如 图 21-3 所 示 。Cognos 8 如 果 使 用 了 号 份 验 证 ， 那 么 用 户 在 登录 时 必须 提供 有 效 的 身 
份 任 证 ， 比 如 合法 的 用 户 名 和 有 效 的 密码 等 。 

Cognos If] 5 £5 prism #5: LDAP, Windows NT LAN 管理 、 微软 的 Active 目录 、eTrust 站 
点 和 目 定 义 的 Java 供应 


Cognos Configuration — liugf PEE 


Eile Edit View Actions Help 














Lc ——— Cognos - Namespace - Resource Properties 


[S Local Configuration 
uA Environment Type Cognos 
[Ek Cognos content database Allow anonymous access? True 
= a- w Logging 
| LL (3) |J] File 
E t Cognos 8.. 
Poo] [B "en 8 
NS Portal Services 
B- E Security 
日 三 Authentication 
"CBE 
g- D: meret 
m Cognos 


E Cognos Application Firewall 


B E Data Access 
(3- a Content Manager 
Pod cognos 
: --Hfs] Notification 
日- e) Cognos Planning 
(rey Contributor Data Server 


Checking service status... 





Defines a group of properties related to authentication that applies to all users. 


Use this group of properties to control access to resources based on user identity. 
Do not delete the namespace, or you will not be able to save your configuration. To 
restore the namespace, right-click Authentication, click New, Namespace Type, 
select the Cognos Namespace from the list of available types and specify a name. 











21-3 Cognos 有 身份 验证 
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21.1.3 访问 授权 

访问 授权 是 指 授权 一 定 的 用 户 访 问 或 者 拒绝 访问 指定 数据 ， 特 别 是 一 些 行为 或 者 任务 允 
许 或 拒绝 访问 数据 ， 如 图 21-4 Brzn. 

例如 ，Cognos 管理 员 创建 了 一 些 目录 ， 用 于 存放 Cognos 报表 ， 那 么 他 们 可 以 设置 这 些 
目录 的 安全 性 ， 以 便 只 有 经 过 授权 的 用 户 才 能 但 看 、 释 更 或 者 允许 其 他 的 任务 可 以 对 这 些 目 
录 中 的 报表 进行 调度 操作 。 


Cognos Adlninistration Bifa Bd. 

















Status Security Configuration 
P Users, Groups, and Roles Directory > Cognos c* ad 85 db x Fq 





irs) Capabilities 





Entries: P | - |15 | Q b> b 








E3 User Interface Profiles 



































C] | $ | Namea Modified $ Actions 

O 8e All Authenticated Users August 10, 2011 8:49:45 AM More... 

四 | 55 Analysis Users August 10, 2011 8:49:49 AM More... 

D] à Anonymous August 10, 2011 1:56:32 PM More... 

[] B8 Authors August 10, 20118:49:49 AM More... 

[] B Consumers August 10, 2011 8:49:49 AM More... 

四 55 Controller Administrators August 10, 2011 8:49:47 AM More.. | — 
四 | 3 Controller Users August 10, 2011 8:49:49 AM More... 

O Ba Data Manager Authors August 10, 2011 8:49:49 AM More... 

加 Ba Directory Administrators August 10, 2011 8:49:45 AM More... 

加 | à Everyone August 10, 2011 8:49:45 AM More... 3 





图 21-4 Cognos 访问 授权 


1. AP 

用 户 实体 是 指 在 第 三 方 喘 份 验证 供应 商 创建 和 维护 的 唯一 账户 ， 属 于 一 个 特定 的 人 或 者 
E 计算 机 。 

特别 需要 注意 的 是 ， 在 Cognos 中 不 能 创建 用 户 实体 。 

第 三 方 身 份 验证 供应 商 保存 了 用 户 的 基本 信息 ， 包 括 姓 、 名 字 、 登 录 ID、 蜜 码 、 本 地 语 
言及 邮箱 等 。 而 Cognos 需要 保存 额外 的 信息 ， 例 如 用 户 的 私人 目录 、 在 portal 中 但 看 报表 的 
格式 参数 等 。 

在 第 三 方 喘 份 验证 供应 商 和 Cognos 中 ， 可 以 将 一 个 用 户 分 配给 一 个 或 者 多 个 组 、 角 色 ， 
以 满足 在 业务 中 的 特殊 需求 。 

2. 组 、 角 色 

组 和 角色 代表 了 有 具有 相同 功能 、 状 态 的 一 些 用 户 的 集合 。 组 的 成 员 可 以 是 其 他 组 或 者 用 
P. WB 21-5 所 示 ; 角色 的 成 员 可 以 是 用 户 、 组 或 者 其 他 角色 ， 如 图 21-6 所 示 。 





























图 21-5 Cognos 组 的 成 员 关 系 图 21-6 Cognos 角色 的 成 员 关 系 
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21.1.4 ”加密 服务 


加 密 服 务 能 确保 Cognos 通信 和 敏感 数据 的 安全 。 

1. 使 用 第 三 方 授权 认证 

Cognos 8 依赖 于 认证 授权 的 功能 是 加 密 服 务 。 默 认 情 况 下 ，Cosgnos 8 提供 一 种 简单 的 认 
证 授权 机 制 ， 在 实际 中 可 以 将 其 设置 为 不 可 用 ， 然 后 再 使 用 第 三 方 认 证 授权 。 

2. 标准 的 加 密 服 务 供应 商 

Cognos 包括 以 下 标准 加 密 服 务 。 

(1) SSL 

SSL 协议 用 来 保护 Cognos 8 组 件 和 计算 机 之 间 的 安全 通信 。 

(2) 建立 在 BI 忆 线 消 肯 上 的 可 信 请 来 

使 用 可 信 的 数字 签名 以 保证 它们 来 和 目 于 已 注册 的 Cognos 8 服务 。 

(3) 部 蜀 过 程 加 密 

在 村 入 和 导出 的 过 程 中 使 用 公用 的 算法 来 加 窒 和 解密 数据 。 

(4) 临时 文件 加 密 

公用 的 算法 也 用 来 加 密 和 人 解密 临时 的 文件 。 

数据 库 中 的 存储 数据 依赖 数据 库 安 全 机 制 来 保护 。 

3. 增强 的 加 密 服 务 供应 商 

如 果 需 要 更 强 的 安全 性 ， 那 么 可 以 使 用 增强 的 加 密 服 务 来 蕉 换 标 准 的 加 窒 服 务 。 在 使 用 
标准 的 加 密 服 务 之 后 还 可 以 添加 增强 的 加 密 服 务 。 但 是 需要 注意 的 是 : 一 旦 安装 了 增强 的 加 
密 服 务 并 在 Cognos 8 中 使 用 它 , 那么 将 不 能 返回 标准 的 加 密 服 务 « Cognos 加 密 服 务 如 图 21-7 
BI. 





























Cognos Configuration — liugf 


File Edit view Actions Help 

加 | gm ds? 

[| cognos - Provider - Resource Properties 

B Local Configuration [Name le — — — č) 


&-[8 Environment Type Cognos 
[Ef Cognos content database 米 Certificate location ..Jconfiguration/certs 
*K Confidentiality algorithm RSA security RC4 (40-bit k. 





米 PDF Confidentiality algorithm RSA security RC4 (40-bit k... 
** Supported ciphersuites RSA-R5A-DES(56)CBC-5H... 
Identity name 
(ry Portal Services 米 Server common name CAMUSER 
&-[& security * Organization name Cognos 
日 -上 Authentication 米 Country code CA 
- Cognos Signing key settings 
(3 Cryptography 米 Signing key store location ..Jcanfiguration/signkeypair 
: Signing key store password Mi ee 
Cognos Application Firewall Encryption key settings 
日 -| 时 Data Access 米 Encryption key store location ,.JconfigurationJencryptke... 
[s (gy Content Manager * Encryption key store password Sob 
1L] cognos Certificate Authority settings 
(gy Notification Use third party CA? False 
= a Cognos Planning 米 Certificate Authority service common na... CA 
Contributor Data Server Password 六 站 站 冰冰 冰冰 冰 站 冰冰 冰冰 冰冰 
* Certificate Authority key store password appaiono 
米 Certificate lifetime in days 730 


Defines a group of properties for the Cognos cryptographic provider, 


Configure these properties to set the encryption services and CA service for all 
components accessing a single content store. 

















图 21-7 Cognos 加 密 服 务 
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21.2 ”Cognos 安 全 部 署 





Cognos 8 的 安全 策略 目标 是 : 

e 对 于 准备 访问 授权 数据 的 非法 用 户 进 行 限制 。 

e 阻止 未 授权 的 用 户 修改 数据 。 

e 预防 信息 的 丢失 或 毁坏 。 

e 俏 保 应 用 的 可 用 性 。 

必须 确保 未 经 授权 的 用 户 不 能 以 恶意 的 行为 来 访问 数据 ， 也 必须 预防 合法 用 户 在 应 用 和 
使 用 过 程 中 的 各 种 中 断 情 况 的 发 生 。 

在 设置 安全 性 时 ， 特 别 需要 注意 以 下 方面 。 

(1) 认证 和 授权 

用 户 的 认证 和 授权 机 制 可 以 预防 未 经 授权 的 用 户 访问 系统 组 件 和 数据 。 安 全 策略 的 有 效 
性 依赖 于 认证 和 授权 的 类 型 。 

(2) Web 请 求 和 内 容 验 证 

在 数据 传输 之 前 ，Web 请 求 和 内 容 验 证 需要 检查 数据 。 安 全 策略 的 有 效 性 依赖 于 验证 技 
术 ， 例 如 验证 和 预防 缓存 溢出 。 

(3) 会 话 管 理 

安全 策略 的 有 效 性 依赖 于 系统 使 用 的 会 话 管理 的 类 型 ， 包 括 信息 和 程序 的 生命 周期 需要 
验证 。 

(A) 传输 过 程 中 的 安全 

在 使 用 不 可 信 站 点 的 网 络 时 ， 明 确 哪 些 敏感 的 信息 需要 传输 ， 安 全 策略 的 有 效 性 依赖 于 
什么 样 的 数据 和 哪些 数据 需要 加 密 和 传输 。 

(5) 加 密 

加 密 保 护 敏 感 的 信息 ， 例 如 账户 认证 和 私人 信息 。 

(6) 日 志和 监控 

当 错 误 太 生 、 事 务 结束 时 ， 应 用 程序 将 进行 日 志 标 识 。 此 外 ， 应 用 日 志 记 录 包 括 提供 系 
统 信息 的 错误 信息 ， 该 错误 信息 在 满足 业务 需要 的 同时 ， 应 该 包括 最 少 的 账户 信息 。 安 全 策 
略 的 有 效 性 依赖 于 储存 了 哪些 错误 的 日 六 信息 。 

(7) 管理 员 

管理 员 账 户 包 括 新 增 和 删除 用 户 、 提 供 组 或 者 给 予 角 色 的 访问 、 配 置 应 用 组 件 等 功能 ， 
因此 ， 和 省 理 员 账 户 应 该 限制 开放 给 适当 的 人 员 操 作 。 安 全 策略 的 有 效 性 需要 考虑 依赖 于 什么 
样 的 应 用 需求 管理 ， 怎 样 保 护 管 理 员 的 安全 选项 配置 。 


21.2.1 操作 系统 安全 技术 


操作 系统 是 应 用 运行 的 物理 环境 , 任何 攻击 操作 系统 的 行为 部 可 能 危害 应 用 程序 的 安全 。 
因此 ， 使 用 安全 的 操作 系统 可 以 使 应 用 环境 达到 较 高 的 称 定 性 。 

系统 的 物理 安全 是 上 必 人 不 可 少 的 。 威 胁 可 能 来 目 于 Web， 但 是 也 可 以 来 目 于 一 合 物理 终 站 
设备 。 假 设 Web 访问 是 安全 的 ， 如 果 攻 击 者 可 以 对 一 台 服 务 占 进行 物理 访问 ， 那 么 强行 破坏 
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系统 是 很 容易 的 。 
建议 您 审查 操作 系统 的 安全 生 略 ， 可 以 从 以 下 几 点 入 手 进 行 操作 。 
(OD 用 户 账 户 
e 在 服务 器 上 限制 用 户 账户 的 数量 。 
e 人 确保 极 少数 的 可 信任 用 户 上 其 有 超级 官 理 员 的 权限 。 
e 授权 特定 用 户 进行 应 用 的 运行 和 操作 。 
(2) 账户 策略 
e 探 作 系统 的 安全 性 可 以 依赖 于 管理 员 的 密码 策略 。 
e 使 用 增强 的 密码 ， 体 护 系统 的 安全 性 。 
€ 在 UNIX 系统 下 ， 激 活 shadow 密码 文件 。 
(32 LRA 
e 授权 用 户 操作 目录 的 只 读 权 限 。 
e 默认 情况 下 拒绝 访问 议 置 。 
(4) 网 络 服务 
e 在 便 件 服务 器 上 控制 必要 的 服务 数量 。 
e 降低 用 户 使 用 网 络 服务 的 访问 权限 级 别 。 
e 确保 用 户 账户 可 以 访问 Web 服务 ， 不 可 以 访问 Shell 功能 。 
€ 在 UNIX FI Linux 系统 下 ， 确 保 /etc 目录 下 未 使 用 的 服务 不 存在 res. rc0—rc6 文件 。 
e 在 Window 系统 下 ， 人 确保 未 使 用 的 服务 没有 运行 ， 并 且 不 要 设置 成 日 动 运行 。 
@ 在 UNIX 系统 下 ， 确 你 必要 的 服务 的 运行 。 
e 减少 信任 的 端口 数量 ， 特 别 是 /etec/services 文件 。 
e 你 护 系统 免 受 NetBIOS 威胁 ， 例如 137、138、139 mH- 
e FHERR, HEU iptables. 
e 如 果 可 能 ， 尽 量 避 免 使 用 GUI 服务 。 
(5) 系统 补丁 
e 在 操作 系统 上 运行 最 新 的 、 推 荐 的 供应 商 的 补丁 。 
e 为 安全 补丁 设置 规律 的 维护 调度 。 
(6) 操作 系统 最 小 化 
e 删除 非 必要 的 应 用 ， 以 降低 系统 受到 攻击 的 可 能 性 。 
@ 限制 本 地 服务 对 服务 的 操作 。 
e Ud AE d. 
(7) 日 志和 监控 
e 日 志 安 全 相关 的 事件 ， 包 括 成 功 或 者 失败 的 登录 、 退 出 和 改变 用 户 的 准 入 性 。 
e 临 控 系统 日 志文 件 。 
e 限制 访问 系统 日 忘 文件 以 增强 安全 性 。 
e 安全 日 志 配 置 文 件 。 
e 确保 在 Web 服务 器 上 可 以 安全 地 访问 日 志 。 
(80 系统 的 完整 性 
e 创建 生产 系统 以 保护 系统 的 完整 性 。 
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e 定期 检查 系统 ， 包 括 和 原始 系统 的 快照 进行 比较 。 
e 使 用 第 三 方 审计 软件 进行 系统 的 完整 性 检查 。 
e 基于 一 定 规则 去 备份 系统 的 资源 。 


21.2.2 ”网 络 安全 技术 


网 络 是 进入 应 用 的 一 个 点 ， 因 此 ， 网 络 安全 机 制定 预防 外 来 入 侵 的 第 一 道 防 线 。 网 络 安 
全 涉及 协议 、 通 信 通 直 和 安全 设备 ， 例 如 路 由 堪 、 防 火场 和 交换 机 。 

可 以 从 以 下 几 个 方面 入 手 来 增强 网 络 安全 。 

e 使 用 防火 墙 。 

e 确 你 防火 墙 能 所 供 包 的 转发 和 过 小 功能 。 

e 限制 访问 关口 的 数量 。 

e 限制 某 些 端口 的 流量 的 方 问 。 

e 限制 未 些 网 络 协议 ， 例 如 ping. 


21.2.3 ”应 用 安全 技术 


使 用 内 置 的 安全 功能 ， 可 以 将 Cognos 8 的 安全 性 最 大 化 。 这 里 提供 的 最 好 的 做 法 不 是 一 
个 配置 安全 需求 的 完整 的 列表 ， 以 下 几 点 是 解决 问题 的 关键 。 

(1) 特别 推荐 一 一 使 用 Cognos 应 用 防火 墙 

Cognos 应 用 防火 墙 (CAF) 补充 了 现 有 Cognos 8 的 安全 架构 。 默 认 情 况 下 ，CAF 是 
可 用 的 。 为 了 人 确保 Cognos 8 的 解决 方案 是 安全 的 ，CAF 在 生产 环境 中 不 应 该 被 荣 用 。 

在 分 布 式 环境 中 ， 所 有 已 安装 的 Cognos 8 应 用 层 组 件 的 计算 机 上 的 CAF 设置 必须 是 一 
SH]. WR CAF 在 茶 些 计算 机 上 是 不 可 用 的 ， 而 在 另 一 些 计算 机 上 可 用 的 ， 这 样 可 能 会 导致 
其 他 意外 的 行为 和 产品 错误 的 发 生 。 

CAF 保护 处 理 恶 总数 据 的 Cognos 8 组件。 最 常见 的 形式 是 恶意 数据 的 绥 存 区 淤 出 和 器 站 
点 脚本 攻击 (XSS 链接 )， 或 者 通过 在 有 效 的 网 页 或 者 重 定 问 到 其 他 网 站 的 脚本 注入 。 

使 用 Cognos Configuration 时 ， 可 以 改变 第 三 方 的 XSS 工具 文 持 的 设置 ， 并 添加 包括 主 
机 名 和 域名 的 有 效 名 称 的 Cognos 列表 。 

还 可 以 跟 踩 防火 揪 活动， 检 簿 包含 被 拒绝 请 求 的 日 忘 文件 。 默 认 情 况 下 ， 日 忘 信息 存储 
在 Cognos 8 本 地 位 置 \logs\ cogserver.log 文件 里 。 

(2) 配置 加 密 环 境 

建议 在 评估 环境 之 前 ， 先 备份 安全 级 列 。 

(3) 安全 的 临时 文件 

Cognos 8 使 用 报告 活动 期 间 的 临时 文件 存储 最 近 但 看 过 的 报告 。 该 文件 是 不 加 密 的 。 由 
于 报告 可 能 包含 敏感 数据 ， 它 们 应 该 是 安全 的 。 

建议 采取 以 下 措施 : 

1) 限制 访问 临时 文件 目录 。 

2) 司 用 临时 文件 加 密 。 

(4) 安全 访问 Cognos Connection 的 技术 

如 果 在 Cognos 配置 中 添加 了 一 个 身份 验证 ,那么 在 目录 中 的 所 有 用 户 都 拥有 访问 Cognos 


416 




























































































Connection 的 权限 。 为 了 确保 Cognos 8 的 安全 ， 需 要 限制 该 访问 。 


(5) 安全 的 PowerCube 
部 著 到 Cognos 8 PowerCube 的 MDC 文件 继续 留 在 文件 系统 中 。 作 为 一 个 额外 的 安全 指 


施 ， 建议 : 


1) 设立 限制 PowerCube 数据 源 的 访问 。 

2) PowerCube 的 数据 源 使 用 第 三 方 的 文件 加 密 系 统 。 

3) 设置 Cognos 8 中 包含 cube 的 目录 的 权限 。 

4) 授予 必须 添加 或 删除 目录 中 的 cube 的 用 户 读 取 和 写 入 权限 。 

5) 授予 用 来 局 动 Cognos 8 服务 的 域 用 户 账 户 的 读 取 权限 。 

(6) 安全 的 数据 源 签名 

Cognos 8 使 用 数据 源 签 名 来 访问 报表 数据 库 中 的 基础 数据 。 

(7) 安全 的 内 容 存储 

为 了 确保 其 安全 性 和 完整 性 ， 在 Cognos 配置 中 ， 内 容 存 储 通 过 使 用 单数 据 登 录 访 问 














Content Manager 服务 。 


性 、 


然而 ， 内 容 存储 的 安全 性 不 仅 依赖 于 Cognos 8 的 安全 性 ， 而 且 依 赖 于 本 地 数据 库 的 安全 
操作 系统 的 安全 性 和 网 络 的 安全 性 。 

(80 为 了 确保 数据 库 的 安全 性 ， 建 议 避 人 循 下 列 准 则 

1) 数据 库 和 数据 库 API 使 用 数据 库 、 网 络 和 操作 系统 提供 的 安全 性 机 制 。 

2) 分 配 有 限 数量 的 用 户 以 维护 数据 库 。 

3) 使 用 本 地 安全 的 数据 库 ， 仅 授予 最 低 权 限 的 用 户 账户 访问 。 

4) 限制 内 容 管理 表 的 该 写 访 问 的 用 户 数量 。 

5) 采纳 由 数据 库 供应 商 提 供 的 其 他 安全 性 建议 。 

















21.2.4 ”安全 审计 





Cognos 8 使 用 安全 审计 作为 管理 方式 来 检查 执行 安全 策略 的 有 效 性 。Cosgnos 安全 审计 图 





如 图 21-8 所 示 。 





MERE 


图 21-8 Cognos 安全 审计 图 
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21.3 ”Cognos 安 全 实践 





在 本 市 将 进行 Cognos 安全 性 设置 的 学 习 。 
21.3.1 创建 Cognos 组 、 角 色 


登录 Cognos Connection 控制 台 后 , 选择 Launch 一 Cognos Administration 命令 进入 Cognos 
管理 界面 ， 如 图 21-9 所 示 。 


($ Public Folders — Cognos Connection 


[IDEE |— CEST 
EN Query Studio 
(QU Analysis Studio 


[E] 33 CS i € li. Report Studio 
e Event Studio 


Kj Dril-through Definitions 





(iis | 


Public Folders 


Public Folders 





My Folders 





Entries: | 


| Name $ | Modified $ 


y Cognos Administration 











图 21-9 Cognos 安全 实践 (一) 
Cognos Administration H1 3 部 分 组 成 : Status〈 状 态 )、Security〈 安 全 ) 和 Configuration 
(配置 )， 如 图 21-10 所 示 。 
€ Status GAS): 记录 未 发 生 的 、 当 前 的 和 已 友 生 的 活动 ， 
€ Security (ZE): Cognos 用 户 、 组 和 角色 的 设置 和 管理 
€ Configuration (WME): 数据 库 连 接 、 内 容 管理 等 信息 。 


e Cognos Administration 


系统 和 调度 的 信息 © o 


Cognos Administration 





Status | 


UD current Activities 


Security 





g Past Activities 


区 Upcoming Activities 
Qj) system 


ES Schedules 


($) Background activities 


O Interactive activities 





Run by: 
Any user 
Select a user... 


Status: 
Any 

Priority: 
A 


« —.. i 


Bifa a Rd. ? ~ 
Configuration 


Current Activities - Background activities 


Total (0) 


SE m ur £g = 


Pending 
Executing 


Waiting 


Suspended 





Entries: 


Request time $ Run by Status $ Priority 


No entries. 





Last refresh time: August 10, 2011 9:14:56 AM 











图 21-10 Cognos 安全 实践 (二 ) 
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选择 Security 选项 卡 ， 进 入 后 单 击 Users, Groups, and Roles 菜单 ， 如 图 21-11 所 示 。 


o7 Cognos ådministration BRSIES 


Cognos Administration Bifa 8 "tant ? v» 





Configuration 


P Users, Groups, and Roles Directory pen Q 





iTi Capabilities 





© | al 


[]| |Namea | Modified $ | Active | Actions 














图 User Interface Profiles 


gĝ Coonos August 10, 20118:49:48AM v More... 
Last refresh time: August 10, 2011 9:39:16 AM 











图 21-11 Cognos 安全 实践 (三 ) 


在 右 侧 Directory 区 域 选择 Cognos PETZ, fate SEAT PERI, An] 21-12 所 示 。 


©) Cognos Admije stration 加 回国 


Cognos Administration BiAA «dT. ? ~ 








Configuration 
I users, Groups, and Roles Directory » Cognos cá af as d x F q ^ 


irs) Capabilities 




















ies: 4/44 
图 User Interface Profiles itis E © biie 





| Name a | Modified $ | Actions 
à All Authenticated Users August 10, 2011 8:49:45 AM More.. 
85 Analysis Users August 10, 2011 8:49:49 AM More.. = 
Q Anonymous August 10, 2011 8:53:16 AM More.. 
Ba Authors August 10, 2011 8:49:49 AM More... 
Bj Consumers August 10, 2011 8:49:49 AM More.. 
$5 Controller Administrators August 10, 2011 8:49:47 AM More... 
Bj Controller Users August 10, 2011 8:49:49 AM More. - 
Ba Data Manager Authors August 10, 2011 8:49:49 AM More.. 
BM Directory Administrators August 10, 2011 8:49:45 AM More.. 
Bg Everyone August 10, 2011 8:49:45 AM More... 


More... 


3 


PW D P9 D" P9 9" P" P9" P9 9 [I 


BA Express Authors August 10, 2011 8:49:49 AM More.. M 
li | 





图 21-12 Cognos 安全 实践 (四 ) 
单 击 “ 创 建 组 ”按钮 留 ， 跳 转 人 到 新建 组 癌 导 指南 ， 如 图 21-13 Przs. 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 





Sales 





Description: 


Sales Department 








Screen tip: 











Sales 





Location: 
Directory » Cognos 
Select another location... 


Cancel 





Next > Finish 





图 21-13 Cognos 安全 实践 CA.) 
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单 击 Next 按钮 ， 跳 转 至 选择 用 户 页 面 ， 直 接 单 击 Finish 按钮 完成 组 的 创建 ， 如 图 21-14 
所 示 。 


select the members - New Group wizard Help 


Select the members of this entry. 


Entries: [| ]-L JO 14 [44 | | | bl 


No entries. 





Add... Remove 





re || ce | [ necs ][ om 


图 21-14 Cognos 安全 实践 (六 ) 





组 创建 完成 之 后 ， 返 回 到 列表 页 面 ， 可 以 看 到 了 刚才 创建 的 Sales 组 ， 如 图 21-15 所 示 。 


[]| $ |Namea | Modified $ | Actions 

[] Bj Planning Rights Administrators August 10, 2011 8:49:46 AM More... 
F] 5 Portal Administrators August 10, 2011 8:49:46 AM More... 
[] B Query Users August 10, 2011 8:49:49 AM More... 
[] Bà Readers August 10, 2011 8:49:49 AM More... 
Fi 85 Report Administrators August 10, 2011 10:16:59 AM More... 
Bg Sales August 10, 2011 10:16:27 AM More... 
85 Server Administrators August 10, 2011 8:49:45 AM More... 
a5 System Administrators August 10, 2011 8:49:49 AM More... 


Last refresh time: August 10, 2011 10:18:07 AM 


图 21-15 Cognos 安全 实践 (七 ) 


口 
口 
口 





继续 创建 贡 色 ， 单 击 “ 创 建 角色 ”按钮 器 ， 跳 转 至 新 建 角 色 向 导 指南 ， 如 图 21-16 Bro. 
Spat a rame and deserpton ve ip 


Specify a name and location for this entry. You can also specify a description and screen tip. 


Name: 


Leader 


Description: 
Sales Leader 


Directory > Cognos 
Select another location... 


Cone | [e | [ wet | [ mer | 
图 21-16 Cognos 安全 实践 〈 八 ) 


单 击 Next 按钮 , 跳 转 至 选择 用 户 页 和 面 , 直接 单 击 Finish 按钮 完成 角色 的 创建 , 如 图 21-17 
所 示 。 
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Select the members - New Role wizard 


Select the members of this entry. 





Entries: [| ] - [| ] © 


No entries, 


4144 Pp | 











Cancel | | « Back 





| 


Next > 


|| Fnsh | 





图 21-17 Cognos 安全 实践 Ju) 








Add... 


Remove 


角色 创建 完成 之 后 ， 返 回 到 列表 页 面 ， 可 以 看 到 刚才 创建 的 Leader 角色 ， 如 图 21-18 


所 示 。 

















[]| $ |Namea | Modified $ | Actions 
四 à All Authenticated Users August 10, 2011 8:49:45 AM More... 
Fi $5 Analysis Users August 10, 2011 8:49:49 AM More... 
DL] &à Anonymous August 10, 2011 8:53:16 AM More... 
O BB Authors August 10, 2011 8:49:49 AM More... 
O BB Consumers August 10, 2011 8:49:49 AM More... 
Fi $3 Controller Administrators August 10, 20118:49:47 AM More... 
F $5 Controller Users August 10, 2011 8:49:49 AM More... 
[] B Data Manager Authors August 10, 2011 8:49:49 AM More... 
Fi $3 Directory Administrators August 10, 2011 8:49:45 AM More... 
O 8g Everyone August 10, 2011 8:49:45 AM More... 
[] B Express Authors August 10, 2011 8:49:49 AM More... 
O B Leader August 10, 2011 10:31:42 AM More... 
Fj 85 Metrics Administrators August 10, 2011 8:49:46 AM More... 
[] Bé Metrics Authors August 10, 2011 8:49:49 AM More... 
Fj $3 Metrics Users August 10, 2011 8:49:49 AM More... 
Last refresh time: August 10, 2011 10:31:48 AM 








图 21-18 Cognos 安全 实践 (F) 


21.3.2 为 组 、 角 色 添 加 用 户 成 员 
打开 用 户 、 和 角色 、 组 列表 页 面 ， 如 图 21-19 所 示 。 


Ci af 8j X E X Fa 


Directory » Cognos 














Entries: F © 44 » M 
O | $ |Namea | Modified $ | Actions 
口 8g All Authenticated Users August 10, 2011 8:49:45 AM More... 
L1 Ba Analysis Users August 10, 2011 8:49:49 AM More... 
DL] ĝ Anonymous August 10, 2011 10:37:07 AM More... 
O B authors August 10, 2011 8:49:49 AM More... 
O B Consumers August 10, 2011 8:49:49 AM More... 
L1 85 Controller Administrators August 10, 2011 8:49:47 AM More... 
L1 85 Controller Users August 10, 2011 8:49:49 AM More... 
[] B Data Manager Authors August 10, 2011 8:49:49 AM More... 
L1 85 Directory Administrators August 10, 2011 8:49:45 AM More... 
L1 8g Everyone August 10, 2011 8:49:45 AM More... 
口 85 Express Authors August 10, 2011 8:49:49 AM More... 
O B Leader August 10, 2011 10:31:42 AM More... 
Fi 85 Metrics Administrators August 10, 2011 8:49:46 AM More... 
[] B Metrics Authors August 10, 2011 8:49:49 AM More... 
[] Bà Metrics users August 10, 2011 8:49:49 AM More... 
Last refresh time: August 10, 2011 10:37:07 AM 








Z| 21-19 Cognos 安全 实践 (十 一 ) 
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选择 一 个 组 或 角色 ， 单 击 对 应 的 Actions PPA RERE” ART, BU BASED. 


Set properties - Leader 





Help 
General Members Permissions 
Specify the properties for this entry. 





Type: Role Location: Directory > Cognos View the search path, ID and URL 
Owner: Anonymous Created: August 10, 2011 10:31:42 AM 
C] Disable this entry 


Modified: August 10, 2011 10:31:42 AM 
Icon: — [B Standard Edit... 
The name, screen tip and description are shown for the selected language. 
Language: 
English (United States) ~ 





Name: 





Description: 
Leader Sales Leader 


Screen tip: 





Leader 








Advanced routing 


Override the routing sets acquired from the parent entry 
Routing sets: 
No values saved 
Set... 





ok || cancel | 


图 21-20 Cognos 安全 实践 (FZ) 
选择 Members 选项 卡 ， 跳 转 至 用 户 成 员 选 择 页 面 ， 如 图 21-21 所 示 。 


Set properties - Leader 


Help 
General Members Permissions 


Select the members of this entry. 








Enties:| — ]-[  ]QO|! map 


No entries. 











Add... Remove 
| OK | | Cancel | 





图 21-21 Cognos 安全 实践 (十 三 ) 
单 击 Add 按钮 ， 跳 转 至 选择 用 户 页 面 ， 如 图 21-22 所 示 。 


Select entries (Navigate) - Leader 


Help 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and dick the arrow button to Type Search 
update the Selected entries list. 
Available entries 


Directory 


Selected entries 


Entries: | — ]-| 四 Im 


C Show users in the list 





口 | |.» Name 
Entries: [1 |-[ ]O! | ma [>] 
O| [Name 


&B coqnos 





No entries. 








Remove 


Canca 


图 21-22 Cognos 安全 实践 (十 四 ) 
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选择 Available entries Directory 的 Cognos 链接 , 单 击 后 显示 所 有 用 户 实体 信息 ,如 网 21-23 
所 示 。 


Select entries (Navigate) - Leader Help 


arrow button to update the Selected entries list. 


Available entries Selected entries 


Directory > Cognos Entries: - O PHIS 
[C] Show users in the list 


Entries: [1 ]-[s |© | mem 


| Name 
8g All Authenticated Users No entries. 





85 Analysis Users 
Ba Authors 
85 Consumers 








Remove 





Ba Controller Administrators 
85 Controller Users 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and dick the Type Search ^ 
B Data Manager Authors 





Ba Directory Administrators 
8g Everyone 
83 Express Authors 


Ba Leader 


MA Metrics Administrators 


图 21-23 Cognos 安全 实践 (CFA) 
选中 其 中 一 个 用 户 实 体 ， 如 Sales 组 ， 单 击 > 按钮， 将 Sales 组 添加 到 Selected entries 
列表 ， 如 图 21-24 所 示 。 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want and click the arrow Iype Search 
button to update the Selected entries list. 





ry ry r9 r9 U DS DI DJ DSL G 


I« 


Available entries Selected entries 


Directory > Cognos Entries: - © | «mir 


E Show users in the list 
> rre 
ees 区 ]-[5 10. | 同和 y mem 





Remove 
$5 Planning Rights Administrators 
Bj Portal Administrators 

85 Query Users 

B Readers 

$5 Report Administrators 

à Sales 

8s 
8s 


Server Administrators 


FW [pw PW DW D9 N N 


System Administrators 








图 21-24 Cognos 安全 实践 (十 六 ) 


单 击 OK 按钮 ， 返 回 Members 选项 卡 ， 如 图 21-25 所 示 。 


Set properties - Leader Help 


General Members Permissions 


Select the members of this entry. 








Entries: 1 J-L JO | ma 


O| |-» Name | Type 
O & …> saes Group 





Add... Remove 


图 21-25 Cognos 安全 实践 〈 十 七 ) 
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单 击 OK 按钮 ， 完 成 对 角色 、 组 的 成 员 实 体 设 置 。 
21.3.3 ”在 Framework 中 设置 包 的 访问 授权 


在 Framework Manager 中 新 建 一 个 包 ， 如 图 21-26 Hrs. 
输入 包 的 名 称 后 ， 单 击 Next 按钮 ， 如 图 21-27 所 示 。 











Create Package - Provide Name x| Create Package - Define objects x| 
人 - f = VL < ko. f CI J ox 
A Y^ E i » ^ er N > D 
EN | g | em d po | | oe 
a S | 3 = JA | 3 
Name: Define the objects rou want to include in this package 
Sales? je Using existing packages 
Description: 


(* From the project 






日 -| i3 jales2 
四 -wr 上 SALES 





Screen tip: 








Help | Cancel | < Back Finish | 
IL 





图 21-26 Cognos 安全 实践 〈 十 八 ) 图 21-27 Cognos 安全 实践 (十 九 ) 
选择 包含 的 对 象 后 ， 单 击 Next 按钮 ， 如 图 21-28 所 示 。 


D 
(9) 


Select the set of functions that will be available in this package. 


Available function sets: Selected function sets: 


Define Quality of Service | 
Help | Cancel | 








图 21-28 Cognos 安全 实践 (二 十 ) 
选择 Oracle 函数 集 ， 单 击 Finish 按钮 完成 对 包 的 创建 ， 如 图 21-29 所 示 。 
单 击 Yes 按钮 ， 在 跳 转 的 发 布 问 导 中 选择 包 发 布 的 路 径 ， 单 击 Next 按钮 ， 如 图 21-30 
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所 示 。 


Publish Wizard 一 Select Location Type 


Select publish location 


Folder location in the Content Store: 


[€ Enable model versioning 
"DE 让 一 a Ta nae Nanaeer 


Number of model versions to retain (enter 0 for unlimited versions) 
0 


[ Delete all previous model versions 
! C Location on the network 
You have successfully created your packages. 

- Would you like ta open the Publish Package wizard? 




















TT cancer | 


图 21-29 Cognos 安全 实践 〈 二 十 一 ) K|21-30 Cognos 安全 实践 〈 二 十 二 ) 


在 跳 转 的 安全 访问 授权 框 癌 导 中 ， 可 以 进行 两 种 授权 访问 控制 : User Access OH" Vill 
fin Zl Administrator Access( 管 理 员 访 问 控 制 )， 如 图 21-31 所 示 。 
€ User Access (用 户 访问 控制 ): 设置 用 户 访 问 授权 ,授权 的 组 和 角色 可 以 使 用 该 包 来 创 
建 报表 等 操作 。 


€ Administrator Access (管理 员 访 问 控 制 ): 设置 
对 该 包 进 行 管理 























包 管 理 访问 授权 ， 授 权 的 组 和 角色 可 以 





Publish Wizard 一 Ádd Security 


User ccess Administrator Access | 


Specify access permissions for this package. These settings are only 
available on the initial publis 


Selected groups and roles will be able to administer the package 


Add... 


Remove | 


Hew.. 





Ck mea | 


图 21-31 Cognos 安全 实践 〈 二 十 三 ) 
在 User Access 选项 卡 中 , 单 击 Add FEH, 弹出 选择 组 和 角色 对 话 框 ， 如 图 21-32 所 示 。 
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D Select Users and Groups 


Select entries (Navigate) - Framework Manager Help 


Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you wantand Type Search 
dick the arrow button to update the Selected entries list. 


Available entries Selected entries 


Directory Entries: | -| © | mIa 


厂 Show users in the list 
厂 | |.»Name 














Entries: [1 -| © | mIa 


厂 | |Name 
aĝ doanos No entries, 











Remove 











图 21-32 Cognos 安全 实践 (二 十 四 ) 
单 击 Cognos 链接 ， 找 到 之 前 创建 的 Leader 角色 ， 如 图 21-33 所 示 。 


NE Select Users and Groups 


Select entries (Navigate) - Framework Manager Help 


^ 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want Iype Search — 
and dick the arrow button to update the Selected entries list. 


Available entries Selected entries 


Directory » Cognos Entries: | -| © 4J« ll» 


[^ Show users in the list 


= F | |-> Name 
Entries: [11 - [z3 © | ««»» [> | 





No entries. 


Metrics Administrators 





Metrics Authors 





Remove 
Metrics Users 


Planning Contributor Users 
Planning Rights Administrators 
Portal Administrators 

Query Users 


mM- -= 





10000000 
?B GO OG PG GR Ce c 





| | Cancel | 








21-33 Cognos 安全 实践 (二 十 五 ) 
将 Leader 角色 选中 添加 到 右 侧 的 Selected entries 列表 中 ， 如 图 21-34 所 示 。 


是 Select Users and Groups 


Select entries (Navigate) - Framework Manager Help 


^ 
Navigate the folders, search, or type the names of the users, groups, and roles to add. Select the entries you want Type Search — 
and dick the arrow button to update the Selected entries list. 


Available entries Selected entries 


Directory » Cognos Entries: ji -| © 14||44| b>|[b 


厂 Show users in the list 


TF | |-> Name 
Entries: [u -| 3 © I4 44 >> D [ow 1 


厂 B8 > Leader 
T | |Name Remove | 


Leader 





2 


Metrics Administrators 

Metrics Authors 

Metrics Users 

Planning Contributor Users 
Planning Rights Administrators 
Portal Administrators 


Query Users 





m 
" 
» 
m 
E 
z 
" 


a 





[ 





K | | Cancel 








图 21-34 Cognos 安全 实践 (二 十 六 ) 
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Sat OK 按钮 ， 返 回 安全 设置 问 导 页 面 ， 完 成 Cognos Role 的 添加 ， 如 图 21-35 所 示 。 
用 同样 的 方法 设置 Administrator Access， 如 图 21-36 所 示 。 


Publish Wizard 一 Add Security 


Sp this package 


ecify access permissions for These settings are only 
available on the initial publish. 


Specify access permissions for 
available on the initial publish. 
Selected groups and roles will be able to use this package to create Selected groups and roles will be able to administer the package. 
reports. 





K|21-35 Cognos 安全 实践 (二 十 七 ) 图 21-36 


单 击 Next 按钮 ， 跳 转 全 发 布 页 面 ， 如 图 21-37 Hr. 
单 击 Publish 按钮 ， 完 成 对 包 的 发 布 ， 如 图 21-38 所 示 。 


Publish Wizard — Options 





Publish Wizard — Finish 


C dd 7 È 
(5975 4R 3 Fy 


You have successfully published the package to the following location: 


Directory > Cognos > Anonymous > My Folders > 3113284 
[| Generate the files for erternalized query subjects 


Click Publish to publish rour package. 


(C Publish another package 


The following groups have administrator acc 


ess to the package: 
Leader [Directory > Cognos] 





图 21-37 Cognos 安全 实践 〈 二 十 九 ) 
单 击 Finish 按钮 ， 完 成 包 的 访问 权限 的 设置 。 


图 21-38 Cognos 安全 实践 (三 十 ) 


21.4 kx) 


KENA T Cognos 的 安全 管理 知识 ， 主 要 包括 以 下 内 容 。 


1) Cognos 安全 性 介绍 一 一 针对 Cognos 应 用 防火 场 、 身 份 验证 、 访 问 授权 和 加 密 服 务 进 
行 讲 解 ， 读 者 初步 了 解 了 Cognos 的 安全 机 制 。 


2) Cognos 的 安全 性 可 以 满足 不 同 的 用 户 安 全 需求 。Cognos 提供 了 一 组 灵活 的 、 可 与 现 
有 系统 安全 模型 进行 兼容 的 安全 如 构 。 它 可 以 很 容易 地 与 第 三 方 身 份 验 证 和 加 密 技术 集成 丙 
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进行 整合 。 

3) Cognos 的 安全 性 涉及 以 下 几 点 : 

€ Cognos 应 用 程序 防火 十 。 

€ Cognos 身份 验证 。 

€ Cognos 访问 授权 。 

@ Cognos 加 密 服务 。 

4) 在 Cognos 安全 架构 中 ，Cognos 应 用 防火 场 (CAF) 是 不 可 或 缺 的 组 件 ， 用 来 帮助 
Cognos 抵御 外 来 恶意 数据 的 攻击 ， 比 如 缓存 溢出 和 路 站 脚本 攻击 。 默 认 情 况 下 ，CAEF 将 局 用 ， 
并 且 不 能 被 禁用 。 

5) Cognos 8 的 吴 份 验证 是 由 第 三 方 身 份 验证 提供 程序 进行 管理 的 ， 可 以 用 于 定义 组 、 用 
SENE 

6) Cognos HJA ARUFE: LDAP. Windows NT LAN 管理 、 微 软 的 Active 目录 、eTrust 
站 点 和 目 定 义 的 Java 供应 商 。 

7) 访问 授权 是 指 授 权 一 定 的 用 户 访 问 或 者 拒绝 访问 指定 数据 ， 特别 是 一 些 行为 或 者 任务 
允许 或 拒绝 访问 数据 。 

8) 组 和 角色 代表 了 上 共有 相同 功能 、 状 态 的 一 些 用 户 的 集合 。 组 的 成 员 可 以 是 其 他 组 或 者 
用 户 ， 和 角色 的 成 员 可 以 有 用户、 组 或 者 其 他 角色 。 

9) Cognos 包括 以 下 标准 加 密 服 务 。 

e SSL: SSL 协议 用 来 保护 Cognos 8 组 件 和 计算 机 之 间 的 安全 通信 。 

e 建立 在 BI ARHAR RK: 使 用 可 信 的 数学 签名 以 保证 它们 来 目 于 已 注册 的 

Cognos 8 服务 。 

e 部 闭 过 程 加 密 : 在 寻 入 和 导出 的 过 程 中 使 用 公用 的 算法 来 加 密 和 解密 数据 。 

e 临时 文件 加 蜜 : 公用 的 算法 也 用 来 加 蜜 和 解密 临时 的 文件 。 

10) Cognos 安全 部 加 从 操作 系统 、 网 络 安全 、 应 用 安全 、 安 全 审计 等 几 个 方面 对 
Cognos 的 安全 部 团 进 行 了 系统 分 析 ， 以 期 读者 能 有 一 个 全 和 面 的 安全 防 汽 意识 。 

11) 为 了 确保 数据 库 的 安全 性 ， 建 议 遵循 下 列 准 则 。 

e 数据 库 和 数据 库 API 使 用 数据 库 、 网 络 和 操作 系统 提供 的 安全 性 机 人 制 。 

e 分 配 有 限 数 量 的 用 户 以 维护 数据 库 。 

e 使 用 本 地 安全 的 数据 库 ， 仪 授予 最 低 权 限 的 用 户 账 户 访 问 。 

e 限制 内 容 管 理 表 的 谈 写 访问 的 用 户 数 量 。 

e 采纳 由 数据 库 供应 商 提 供 的 其 他 安全 性 建议 。 

12) Cognos 安全 实践 一 一 在 进行 了 Cognos 安全 性 介绍 和 安全 部 闭 之 后 ， 对 Cognos 安全 
实践 进行 了 简单 的 演示 。 










































































430 


第 22 章 Cognos 优化 


本 章 目 标 

本 章 主 要 介绍 了 Cognos 的 优化 内 容 。 包 括 如 何 增 加 Cognos 的 内 存 来 提高 运行 的 速度 ， 如 
何 提高 Cognos 的 数据 库 访 问 速 度 ， 如 何 通过 修改 Cognos 的 reportservice.xml 参数 提高 运行 的 
效率 ， 如 何 修改 读 取 高 速 绥 存 的 值 来 提升 Cognos 的 性 能 ， 如 何 通过 开启 crosstab caching 提高 
cube 的 访问 速度 ， 如 何在 读 取 数据 时 启用 多 CPU 处 理 ， 如 何 减少 cube 数据 提交 的 次 数 等 内 容 。 

学 习 本 革 后 ， 您 将 掌握 : 

e 如 何 增加 Cognos 8 的 内 存 来 提高 运行 速度 。 

e 如 何 提高 Cognos 8 的 数据 库 访 问 速度 。 

e 如 何 修改 Cognos 8 的 reportservice.xml 参数 。 

e 如 何 通过 修改 读 取 融 速 绥 存 的 值 提 高 性 能 。 

e 如 何 通过 开局 crosstab caching 提高 cube 的 访问 速度 。 

@ 如 何在 读 取 数 据 时 启用 多 CPU 处 理 。 

e 如 何 减 少 cube 数据 提交 的 次 数 。 






































22.1 增加 Cognos 8 的 内 存 以 提高 运行 速度 








当 运 行 Cognos 8 的 服务 右 配 置 较 高 时 , 可 以 适当 增 大 Cognos 8 的 内 存 来 提升 其 运行 的 效 
率 。 例 如 ， 在 图 22-1 中 ， 进 入 到 Cognos Configuration， 修 改 下 列 参数 提高 Cognos 8 的 运行 
速度 ， 如 图 22-2 所 示 。 


Explorer | c8 - Configuration - Resource Properties 
E Local Configuration | 
-- [B Environment Type | ' 
-+i Logging 
[]] Fi 
-Ey Cognos 8 service 





SE 1 iria 优化 内 存 (一 ) 


Enviror nt - Group Prope 





Name 
Deployment fles location deployment 
Data files location „fdata 
* Map fies location ..Imaps 
e Temporary fies location temp 


Encrypt temporary files? False 
orna sperct anon Oc aon On 





* Gateway URI hitp:/flocalhost:80/cognosS/cg-bin/cognos.cgi 


e 
Allow namespace override? False 


** Dispatcher URIs for gateway hitp:/flocalhost:9300/p2pdjserviet/dispakch/ext 
** Controller URI for gateway hitp:/flocalhost:80/cognosS/controllerServer 
Dispatcher Settings 
|| * External dispatcher URI hitp:j/localhost:9300/p2pd|servietdispakch 
类 Internal dispatcher URI htp://localhost:9300/p2pd/serviet/dispatch 
Dispatcher password —— 00000 eee 
Other URI Settings 


** Dispatcher URI for external applications hitp:/flocalhost:9300]p2pd/servlet/dispakch 了 | 





Specfies the sort buffer size to use for local processing. 
Queries which are not processed entirely within a database server may require ^ local processing that involves sorting. Sorting 
E] buffer y à 


c performance 
aa o AREE EAA OADE AA Ood IE mds pce 





图 22-2 Cognos 优化 内 存 (二 ) 
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22.2 ”提高 Cognos 8 的 数据 库 访问 速度 





以 Oracle 数据 库 为 例 ， 修 改 存放 在 A\bin 下 的 cogdmorini 文件 ， 打 开 访 文件 ， 寻 找 字 符 
串 Fetch Number of Rows=， 将 其 剖面 的 分 号 去 挥 ， 将 10 改 成 500。 这 束 表 示 每 次 从 数据 库 中 
取 500 条 数据 ， 大 大 提高 了 对 数据 库 的 访问 速度 。 


22.3 Cognos 8 的 reportservice.xml 参 数 





1) 在 Cognos 8 的 安装 目录 下 找到 c8\webapps\p2pd\WEB-INF\services\reportservice.xml 
Te 
例如 : 


max process 
<init-param> 
<!-- The maximum number of processes that can be running at one time --> 
«param-name»max process</param-name> 
<param-value>2</param-value> 
</init-param> 


其 中 <param-value>2</param-value> 表 示 ReportNet 服务 交互 式 报表 处 理 所 占 用 的 进程 个 
数 ， 默 认 值 一 般 为 2。 有 具体 大 小 可 以 根据 CPU 的 个 数 进 行 调整 ,一般 每 个 CPU 可 以 文 持 两 个 
处 理 进程 数 。 例 如 ， 在 图 22-3 中 该 进程 个 数 和 ReportNet ReportService 服务 中 的 峰值 时 段 内 
报表 服务 的 最 大 进程 数 相 匹配 ， 通 第 非 峰值 时 段 内 报表 服务 的 最 大 进程 数 与 峰值 时 段 内 报表 
服务 的 最 大 进程 数 是 相同 的 。 








L 类 别人 | 名 称 人 


i 
[ (e AE  XUEBBTESDHERRRSBISRTUIDESS fi 
fa 


[ d UE 非 峰 值 时 段 内 报 素 服 务 的 低 亲 和 力 连接 数 


[ d UE 非 峰 值 时 段 内 报 素 服务 的 最 大 进程 数 5 


T a BL 报表 服务 排队 时 间 限 制 ( 秒 数 ) 40 
[ (e 调整 报表 服务 的 最 长 执行 时 间 ( 秒 数 ) o 
厂 & 调整 。” 报表 服务 在 图 表 中 生成 的 热点 数 无 限制 v 


[ (e US o 峰值 时 段 内 报表 服务 的 高 亲和力 连接 数 
[ 篇 调整 峰值 时 段 内 报表 服务 的 低 亲 和 力 连接 数 


[ de 调整 峰值 时 段 内 报表 服务 的 最 大 进程 数 5 


Il 


[ i 调整 报表 服务 的 PDF 字符 编码 Ez 

[ (d 调整 区 许 报表 服务 在 生成 的 PDF 文档 中 嵌入 字体 的 选项 | 允许 € 
[ d 调整 。” 报表 服务 创建 的 PDF 文档 的 PDF 压缩 类 型 古典 

T 镶 调整 — ”报表 服务 创建 的 PDF 文档 的 内 容 压缩 级 别 Be 


图 22-3 Cognos 优化 进程 (一 ) 
2) 在 reportservice.xml 文件 中 修改 ”linger_process。 


«init-param^ 


<!-- The minimum number of processes to keep in memory once they're started --> 
432 


«param-name-^linger processc/param-name^ 
«param-value» 1 «/param-value^ 
«/init-param^ 


其 中 <param-value>1</param-value> 表 示 ReportNet 服务 交互 式 报表 处 理 初始 化 所 占用 的 
进程 数 。 默 认 值 一 般 为 1， 具体 大 小 可 根据 CPU 数 情况 进行 调整 ， 一 般 每 个 CPU 可 支持 一 个 
处 理 进程 数 ， 设 置 该 参数 的 目的 是 提高 服务 器 在 非 峰 值 使 用 时 段 的 处 理 能 力 ， 通 党 该 参数 值 
小 于 或 等 于 最 大 进程 数 。 


3) 在 reportservice.xml 文件 中 修改 max non affine connections per process. 











«init-param^ 
<!-- The maximum number of non-affine connections per process --> 
«param-name»max non affine connections per process-c/param-name^ 
«param-value»4-/param-value^ 

«/init-param^ 


其 中 <param-value>4</param-value> 表 示 ReportNet 服务 交互 式 报 表 处 理 所 占 用 的 线程 数 。 
对 认 值 一 般 为 4， 其 体 大 小 可 以 根据 CPU 数 情 况 进行 调整 ， 一般 每 个 CPU 最 多 可 以 文 持 4 
个 处 理 ， 而 Windows 环境 一 般 设 置 成 两 个 处 理 。 在 图 22-4 中 ， 该 线程 数 和 ReportNet Report 
Service 服务 中 的 报表 服务 的 低 杀 和 力 连 接 数 相 匹 配 。 


r 类 别 $ | 名称 $ 

[ ij "E ”村 烽 值 时 段 内 报表 服务 的 高 亲和力 注 接 数 
[EEE DUE 
[ 的 调整 。 地 烽 值 时 段 内 报表 服务 的 最 大 进程 数 

e "E — 报表 彼 务 排队 时 间 限 制 ( 敌 数 ) 

b 调整 ”报表 服务 的 景 长 执行 时 间 CES) 

e "E 。 报表 服务 在 图 表 中 生成 的 热点 数 

e 调整 。 “峰值 时 段 内 报表 服务 的 高 亲和力 广 按 数 

e 调整 峰 信 时 段 内 报表 服务 的 最 大 进程 数 

à "EO RRSO TS 

e "E — 允许 报表 服务 在 生成 的 POF 文档 中 嵌入 字体 的 选项 

e UE — 报表 服务 创建 的 PDF 文档 的 PDF 压缩 类 型 

e 调整 报表 服务 外 障 的 PDF 文档 的 内 容 压 缩 级 别 


Dog D D DH 
Ii 


71 701717 A 


TET 


图 22-4 Cognos 优化 进程 〈 二 ) 
4) 在 reportservice.xml 文件 中 修改 idle process check interval ms. 


«init-param^ 
<!-- Time period between checks for idle or expired processes (in ms) . 
Everytime we check an idle process we bump its tick count. Every time we use 
a process the count is reset to 0. If the count ever reaches the value 
ofidle process max idle ticks (below) the process is destroyed. 
--> 
<param-name>ldle process check interval ms</param-name> 
«param-value»30000-/param-value^ 

</init-param> .. 


其 中 <param-value>30000</param-value> 表 示 空 闲 进 程 检测 时 间 间 隔 ， 默认 值 为 30000 > 
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单位 为 ms。 目的 是 每 30s frd] — PitkEXET EARN. x84 E IRIRIES, np ADERE 
使 用 效率 。 
5) 在 reportservice.xml 文件 中 修改 idle process max idle ticks. 





«init-param^ 
<!-- number of idle check ticks before an idle process is killed. --> 
«param-name-idle process max idle ticksc/param-name^ 
«param-value»10«/param-value^ 

</init-param> 





其 中 <param-value>10</param-value> 表 示 如 来 菏 个 进程 连续 10 次 航 检 测 为 空闲 进程 ， 则 
PORA MUR. 


6) 在 reportservice.xml 文件 中 修改 queue time limit ms. 


«init-param^ 
<!-- The maximum time a request is queued before it gives up (in ms) --> 
«param-name^queue time limit ms</param-name> 
«param-value»30000-/param-value^ 

«/init-param^ 


其 中 <param-value>30000</param-value> 表 示 报 表 服 务 排队 时 间 限 制 ， 通 第 默认 值 为 
30000 ， 单 位 为 mms。 通常 该 值 和 ReportNet ReportService 服务 中 的 报表 服务 排队 时 间 限 制 ( 秒 
ZO 值 相 匹 配 ， 如 图 22-5 Dr. 
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[ 总 HE  INBGSOEAKUNHSCHED JN 


图 22-5 Cognos 优化 进程 (三 ) 


22.4 修改 读 取 高 速 缓存 的 值 以 提高 性 能 


进入 Cognos Administration 单 击 “配置 ”一 “数据 源 连 接 ”， 单 击 基 于 cube 的 数据 源 ， 单 
击 属 性 ， 然 后 在 弹出 的 窗口 中 蛙 击 连接 ， 修 改 读 取 蜗 速 缓存 的 伪 ， 如 图 22-6 PTR. 


状态 安全 
日 数据 源 连 接 

























修改 读 取 高 速 缓存 
| 大 小 的 值 





o 内 容 管理 编辑 参数 以 构建 Cognos PowerCube ERF P 
通讯 组 和 联系 人 读 取 高 速 缓存 大 小 (MB) : 

名 打印 机 

能 样式 

P potet 位 置 


指定 Windows 操作 系统 上 的 多 推 数据 集 的 位 置 。 加 果 多 维 数 据 集 还 存在 于 Unix 或 Linux 操作 系统 上 ， 寺 输入 其 位 置 。 
Windows 位 置 : 


[d “我 的 文档 和 ansfor mer\powercubes\First_Example. mdc 


S 明度 程序 和 服 各 


图 22-6 Cognos 优化 绥 存 
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22.5 ”开启 crosstab caching 提 高 cube 的 访问 速度 


通过 开启 crosstab caching 提高 cube 的 访问 速度 ， 如 图 22-7 所 示 。 


Drill Through | Dimensions | Auto-Partition 











| Measures 
Cube Group | Data Source | Fackage | Description 
Üutput | General Processing 
Status: 
Optimiration: 
Default (auto-partition) z 
E This cube ir incrementally updated 
[Cube creation Froceszed — — — — — — — 
(* Enabled (* Locally 
C Disabled C Qn the server 
Cube publishing 





(* Enabled 


图 22-7 Cognos 优化 访问 速度 


22.6 ” 读 取 数据 时 启用 多 CPU 处 理 





在 Transformer 中 ， 单 击 DataSource 的 属性 页 面 ， 如 图 22-8 Bros: 可 以 看 到 有 一 个 


Enable multi-processing 复 选 枉 ， 如 果 选 中 它 ， 可 实现 谈 取 数 据 时 局 用 多 CPU 人 处理。 这 样 可 
以 大 大 提升 性 能 。 





Data Source - Products (CSY) 24 xd 


Data Source name: [Products (CSV) 


Source General | Description] 


Timing 





Iv Generate categories 

[ PowerCube creation 

位 Default 

e Generate categories only 


(~ Create the PowerCubesz 





- Uniqueness verification 








-International 
(V Verify category uniqueness Decimal L| 
C Maximize data access Speed 1000 separator: L 





[ Sets the current period 
Enable multi-processing 
Contains externally rolled up measure values 














图 22-8 Cognos 优化 多 处 理 器 
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22.7 ”减少 cube 效 据 的 提交 次 效 


在 bin\trnsfrmr.ini 文件 中 MaxTransactionNum 的 默认 值 为 S00000， 可 适当 将 其 增 大 ， 例 
如 将 其 修改 为 MaxTransactionNum=1000000， 这 样 会 减少 cube 数据 提交 的 次 数 ， 性 能 相应 得 
到 提高 。 


22.8 本章 小 结 


本 章 介 绍 了 Cognos 的 优化 知识 ， 包 括 以 下 几 点 。 

1) 增加 Cognos 的 内 存 来 提高 运行 的 速度 。 

2) 修改 存放 在 *\bin 下 的 cogdmorini 文件 提高 Cognos 的 数据 库 访问 速度 。 
3) 通过 修改 Cognos 的 reportservice.xml 参数 提高 运行 的 效率 。 

4) 通过 修改 读 取 噩 速 绥 存 的 值 来 提升 Cognos 的 性 能 。 

5) 通过 开局 crosstab caching 提高 cube 的 访问 速度 。 

6) 在 读 取 数据 时 启用 多 CPU 处 理 ， 以 提高 Cognos 运行 的 效率 。 

7) 减少 cube 数据 提交 的 次 数 以 提升 Cognos 的 性 能 。 
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技术 词汇 


D 数据 库 的 定义 : 一 系列 的 物理 文件 和 对 应 的 逻辑 结构 被 称 为 数据 库 。 

2) 数据 文件 : 物理 存储 数据 库 的 数据 文件 ， 每 一 个 数据 文件 只 能 对 应 一 个 数据 库 ， 主 要 
包括 数据 表 、 有 索引 和 其 他 的 段 。 

3) His x: 记录 对 数据 库 的 修改 信息 ， 以 备 恢 复数 据 时 使 用 ， 其 体操 作 是 每 一 个 数据 
库 人 至 少 包含 两 个 日 志文 件 组 ， 日 志文 件 组 以 循环 的 方式 进行 读 写 操作 ， 个 日 志文 件 对 应 
一 个 物理 文件 。 

4) 控制 文件 : 是 一 个 较 小 的 二 进 制 文件 ， 用 于 描述 数据 库 的 结构 。 这 个 文件 会 告诉 用 户 
数据 文件 、 临 时 文件 、 重 做 日 志文 件 的 位 置 ， 还 包括 一 些 描述 性 的 信息 。 

5) 参数 文件 : 包括 确定 内 存 络 构 的 大 小 、 议 置 数 据 库 的 默认 值 、 设 置 数据 库 的 范围 、 设 
置 数据 库 的 各 种 属性 、 优 化 数据 库 的 性 能 等 内 容 。 这 些 参 数 文 件 同样 会 告诉 Oracle 实例 在 什 
么 位 置 可 以 找到 控制 文件 。 

6) 块 : Oracle 管理 存储 空间 最 基本 的 单元 ， 也 是 最 小 的 包 辑 存储 单元 。 

7) KE: 比 块 局 一 级 的 逻辑 存储 结构 。 区 段 由 一 系列 块 组 成 。 

8) 段 : 由 多 个 区 段 组 成 ， 区 段 可 以 是 连续 的 ， 也 可 以 是 不 连续 的 。 

9) KEH: 是 最 局 一 级 的 逻辑 存储 结构 ， 数 据 奋 束 是 由 硅 干 个 表 空 间 组 成 的 。 

100. 数据 库 实例 : Oracle 实例 由 内 存 和 一 系列 后 台 进 程 组 成 。Oracle 实例 是 存储 和 控制 
数据 库 的 软件 机 制 |。 

1D) 后台 进程 : 主要 功能 是 为 所 有 的 数据 库 用 户 寞 步 完 成 各 种 操作 任务 ， 从 而 保证 数据 
库 的 实际 运行 任务 正常 进行 。 

12) 内 存 结构 : 主要 包括 系统 全 局 区 (SGA)、 进 程 全 局 区 (PGA)、 用 户 全 局 区 (UGA). 

13) SGA 系统 全 局 区 ): 主要 由 共 圣 池 、 数 据 绥 冲 区 、 日 忘 绥 冲 区 构成 。 

14) 共享 池 : 由 共享 SQL 区 和 数据 字典 区 组 成 ， 参 数 shared pool size 确定 共享 池 的 大 
小 。 

15) 数据 缓冲 区 : 用 于 存储 从 数据 文件 中 旋 取 的 数据 备份 和 临时 存储 数据 库 块 的 地 方 。 

16) 日 志 绥 冲 区 : 以 记录 项 的 形式 备份 到 数据 缕 冲 区 中 被 修改 的 缓冲 块 里 ， 这 些 记 录 人 说 
写 到 日 志文 件 中 ， 从 而 可 以 加 快 数据 库 的 操作 。 

17) 概念 模型 : 一 种 高 层次 的 数据 模型 。 它 定义 了 主要 的 业务 概念 及 其 关系 ， 通 过 分 析 
业务 需求 和 调研 访谈 的 内 容 ， 对 业务 模型 的 一 个 初步 归纳 、 提 炼 的 过 程 。 

18) 逻辑 数 型 ， 是 概念 模型 的 进一步 分 解 细 化 。 它 描述 了 实体 、 属 性 以 及 实体 之 则 的 关 
系 ， 一 般 采 用 第 三 范式 。 

19) 物理 模型 : 在 逻辑 模型 的 基础 上 描述 模型 实体 的 细 方 ， 包 括 选 择 什 么 样 的 数据 库 平 
合 ， 数 据 库 产品 所 对 应 的 数据 类 型 、 长 度 、 索 引 等 因素 ， 为 逻辑 模型 选择 一 个 最 优 的 物理 存 
储 环 境 。 

200 数据 仓库 : 是 一 个 面 问 主 题 的 、 集 成 的 、 稳 定 的 、 反 映 历 史 变 化 的 、 随 看 时 间 的 尝 
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21) 数据 集 市 : 是 满足 特定 的 部 门 或 者 用 户 的 需求 ， 按 照 多 维 的 方式 进行 存储 ， 包 括 定 
义 维 度 、 需 要 计算 的 指标 、 维 上 度 的 层次 等 ， 生 成 面 问 决策 分 析 需 求 的 数据 立方 体 。 

22) OLAP: 联机 分 析 人 处理 ， 英 文 名 称 OnLine Analysis Processing。OLAP 是 根据 用 户 特 
殊 的 需求 而 进行 的 联机 数据 分 析 ， 包 括 对 数据 仓库 的 分 析 ， 是 业务 分 机 人 员 、 中 层 管理 人 员 、 
企业 领导 者 从 多 角度 对 企业 数据 进行 深入 理解 的 一 类 技术 。 

23) 维度 : 人 们 观察 事物 的 角度 。 

24) 层 : 根据 维度 细节 程度 的 不 同 ， 划 分 数据 在 则 辑 上 的 等 级 关系 ， 用 来 摘 述 维度 的 各 
7127 [Bl s 

25) 维度 的 成 员 : 维度 的 取 值 ， 即 维度 中 的 各 个 数据 元 素 的 取 值 。 

26) 钻 取 : 通过 变换 维度 的 层次 ， 改 变 粒 上 度 的 大 小 。 

27) 旋转 : 通过 变换 维度 的 方向 ， 重 新 安排 维 的 位 置 ， 例 如 行列 互 换 。 

280 切片 和 切 块 : 在 一 个 或 者 多 个 维度 上 选取 固定 的 什 ， 分 析 其 他 维度 上 的 度量 数据 ， 
如 条 其 他 维度 剩余 两 个 ， 则 是 切片 。 如 果 是 3 个 ， 则 是 切 块 。 

29) 上 度量: 多 维 数据 的 取 值 。 

300 ROLAP: 是 基于 关系 数据 库 的 OLAP， 以 关系 型 数据 库 为 基础 对 多 维 数据 的 存储 。 

31) MOLAP: 是 基于 多 维 数据 库 的 OLAP， 其 中 切片 、 切 块 是 主要 技术 。 

32) HOLAP: 是 基于 关系 型 和 多 维 窍 阵型 的 混合 型 的 OLAP。 

33) OLTP: 在 线 联机 事务 处 理 ， 主 要 面 问 细节 性 的 数据 ， 存 储 的 都 是 当前 的 数据 ， 被 称 
作 操 作 型 数据 或 者 是 业务 数据 ， 用 来 文 持 日 钊 业务 运作 。 

34) 元 数据 : 在 数据 仓库 系统 的 建立 、 维 护 、 管 理 和 使 用 过 程 中 ， 用 以 描述 实际 数据 的 
Fdo ER AGUA e 

35) 企业 模型 : 根据 业务 系统 的 特点 ， 用 数据 建 模 的 方法 描述 企业 的 各 种 生产 经 营 活动 ， 
是 对 业务 系统 的 抽象 ， 是 企业 信息 化 建设 的 基础 。 

36) ODS: 各 个 业务 系统 之 间 共 至 的 数据 存储 区 ， 是 业务 系统 数据 流动 到 数据 仓库 系统 
之 则 的 缕 冲 区 .。 

37) 星 型 结构 : 主要 包含 事实 表 和 维 表 两 个 部 分 。 事 实 表 主 要 由 业务 相关 的 度量 值 和 与 
维 表 相关 联 的 字段 组 成 ， 维 表 是 存放 维度 的 其 体 信 息 。 

38) 雪花 型 结构 : 雪花 型 模式 是 在 性 型 模式 的 基础 上 ， 对 星 型 结构 的 一 种 拓展 。 通 过 对 
星 型 结构 维 表 的 规范 化 和 细 化 ， 逐 步 建 立 起 规范 的 第 三 范式 数据 结构 ， 这 种 结构 在 形式 上 很 
像 雪 花形 状 ， 所 以 被 称 为 雪花 型 结构 。 

39) 数据 建 模 : 是 指 采 用 实体 -关系 的 方法 ， 用 图 形 化 的 形式 去 描述 业务 规则 的 过 程 。 

40) 数据 模型 : 是 指 用 实体 、 实 体 的 属性 、 实 体 之 间 的 关系 对 企业 在 运营 活动 中 涉及 的 
所 有 业务 概念 和 业务 活动 进行 统一 的 定义 和 搞 述 。 
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